XYZ анализ - коэффициент вариации - подготовка данных к прогнозу.

Нам приходится сталкиваться с расчётом таких значений, как дисперсия, среднеквадратичное отклонение и, разумеется, коэффициент вариации. Именно расчёту последнего стоит уделить особое внимание. Очень важно, чтобы каждый новичок, который только приступает к работе с табличным редактором, мог быстро подсчитать относительную границу разброса значений.

Что такое коэффициент вариации и для чего он нужен?

Итак, как мне кажется, нелишним будет провести небольшой теоретический экскурс и разобраться в природе коэффициента вариации. Этот показатель необходим для отражения диапазона данных относительно среднего значения. Иными словами, он показывает отношение стандартного отклонения к среднему значению. Коэффициент вариации принято измерять в процентном выражении и отображать с его помощью однородность временного ряда.

Коэффициент вариации станет незаменимым помощником в том случае, когда вам необходимо будет сделать прогноз по данным из заданной выборки. Этот индикатор выделит главные ряды значений, которые будут наиболее полезными для последующего прогнозирования, а также очистит выборку от малозначительных факторов. Так, если вы видите, что значение коэффициента равно 0%, то с уверенностью заявляйте о том, что ряд является однородным, а значит, все значения в нём равны один с другим. В случае, если коэффициент вариации принимает значение, превышающее отметку в 33%, то это говорит о том, что вы имеете дело с неоднородным рядом, в котором отдельные значения существенно отличаются от среднего показателя выборки.

Как найти среднее квадратичное отклонение?

Поскольку для расчёта показателя вариации в Excel нам необходимо использовать среднее квадратичное отклонение, то вполне уместно будет выяснить, как нам посчитать этот параметр.

Из школьного курса алгебры мы знаем, что среднее квадратичное отклонение - это извлечённый из дисперсии квадратный корень, то есть этот показатель определяет степень отклонения конкретного показателя общей выборки от её среднего значения. С его помощью мы можем измерить абсолютную меру колебания изучаемого признака и чётко её интерпретировать.

Рассчитываем коэффициент в Экселе

К сожалению, в Excel не заложена стандартная формула , которая бы позволила рассчитать показатель вариации автоматически. Но это не значит, что вам придётся производить расчёты в уме. Отсутствие шаблона в «Строке формул» никоим образом не умаляет способностей Excel, потому вы вполне сможете заставить программу выполнить необходимый вам расчёт, прописав соответствующую команду вручную.


Для того чтобы рассчитать показатель вариации в Excel, необходимо вспомнить школьный курс математики и разделить стандартное отклонение на среднее значение выборки. То есть на деле формула выглядит следующим образом - СТАНДОТКЛОН(заданный диапазон данных)/СРЗНАЧ(заданный диапазон данных). Ввести эту формулу необходимо в ту ячейку Excel, в которой вы хотите получить нужный вам расчёт.

Не забывайте и о том, что поскольку коэффициент выражается в процентах, то ячейке с формулой нужно будет задать соответствующий формат. Сделать это можно следующим образом:

  1. Откройте вкладку «Главная».
  2. Найдите в ней категорию «Формат ячеек » и выберите необходимый параметр.

Как вариант, можно задать процентный формат ячейке при помощи клика по правой кнопке мыши на активированной клеточке таблицы. В появившемся контекстном меню, аналогично вышеуказанному алгоритму нужно выбрать категорию «Формат ячейки» и задать необходимое значение.


Выберите «Процентный», а при необходимости укажите число десятичных знаков

Возможно, кому-то вышеописанный алгоритм покажется сложным. На самом же деле расчёт коэффициента так же прост, как сложение двух натуральных чисел. Единожды выполнив эту задачу в Экселе, вы больше никогда не вернётесь к утомительным многосложным решениям в тетрадке.

Всё ещё не можете сделать качественное сравнение степени разброса данных? Теряетесь в масштабах выборки? Тогда прямо сейчас принимайтесь за дело и осваивайте на практике весь теоретический материал, который был изложен выше! Пусть статистический анализ и разработка прогноза больше не вызывают у вас страха и негатива. Экономьте свои силы и время вместе с

Из данной статьи вы узнаете:

  • ;
  • Как сделать XYZ анализ в Excel ;
  • Применение XYZ анализа при подготовке данных к прогнозу.


Как рассчитать коэффициент вариации в Excel

Это показатель, отражающий разброс значений относительно среднего (отношение стандартного отклонения к среднему значению). Коэффициент вариации измеряется в процентах и отражает однородность временного ряда.

Коэффициент вариации - это отличный показатель, который поможет вам в подготовке данных для прогноза. Коэффициент вариации - индикатор, который поможет вам выделить ряды, на которые стоит обратить внимание перед расчетом прогноза и очистить данные от случайных факторов.

Если коэффициент равен 0%, то ряд абсолютно однородный, т.е. все значения между собой равны.

Если коэффициент вариации больше 33%, то по классической теории ряд считается неоднородным, т.е. большой разброс данных относительно среднего значения.

Например:

Однородный ряд

Неоднородный ряд

Как рассчитать коэффициент вариации в Excel

Коэффициент вариации = отношение стандартного отклонения к среднему

В Excel коэффициент вариации можно рассчитать с помощью следующей формулы:

  • СТАНДОТКЛОНПА(J6:M6) - формула для расчета значения стандартного отклонения в Excel за анализируемый период;
  • (СУММ(J6:M6)/СЧЁТЕСЛИ(J6:M6;">0")) - среднее за анализируемый период;

Вводим формулу в ячейку, получаем расчет коэффициента вариации


Протягиваем формулу на весь массив данных.

Как сделать XYZ анализ?

Теперь сегментируем наши коэффициенты вариации и присваиваем каждому одну из 3-х букв X Y и Z

  • X - для рядов с коэффициентом вариации от 0% до 10%
  • Y - для рядов с коэффициентом вариации от 10% до 25%
  • Z - для рядов с коэффициентом вариации от 25% и больше

Вводим в ячейку Excel формулу

ЕСЛИ(N3<=0,1;"X";ЕСЛИ(N3<=0,25;"Y";"Z"))


Применение XYZ анализа при подготовке данных к прогнозу

Работая с большим массивом данных при подготовке данных к прогнозу, необходим индикатор, который будет подсказывать, на какие временные ряды в первую очередь стоит обратить внимание. В качестве индикатора вы можете использовать "коэффициент вариации" или XYZ анализ.

Если коэффициент вариации больше 10 - 25% или для Y и Z рядов , то изучаем данные (например, продажи товара по месяцам в разрезе направлений продаж) и определяем факторы, повлиявшие на отклонение.

Добавляем фильтр на столбец XYZ анализ и анализируем ряды.

Сначала отфильтруем ряды с коэффициентом вариации больше 25% или Z


Изучаем ряды с большими отклонениями фактических данных за последние 4-5 месяцев. Определяем причины провалов или резких подъёмов продаж. Готовим данные для прогноза. Очищаем данные от влияния случайных факторов или корректируем дефицит.

Также, если в ряду большая неоднородность, то имеет смысл группировать временной ряд. Например,

  • Неоднородные продажи по месяцам свернуть до продаж по кварталам,
  • Продажи по неделям свернуть до продаж по месяцам,
  • Продажи по товарам свернуть до товарных групп...

Сделать прогноз по однородной группе более высокого уровня, а затем распределить пропорционально логики внутри группы.

Затем выделяем ряды с коэффициентом вариации Y


Аналогично просматриваем каждый ряд, и в случае, если замечаете нестандартное поведение ряда, выявляете причины и в случае необходимости очищаете данные.

Рекомендуем создать список факторов (например, акции по стимулированию сбыта, отсутствие товара на складе, спец клиенты...), и для каждого из факторов определить показатель, который вычитаем или прибавляем к данным для прогноза.

После того, как данные очищены от факторов, которые в будущем не повторятся и подготовлены для прогноза, мы рассчитываем прогноз продаж.

Инструкция

Для того чтобы найти коэффициент вариации, используйте следующую формулу:
V=σ/Хср, где
σ - среднее квадратическое отклонение,
Хср – средняя арифметическая вариационного ряда.

Учтите, что коэффициент вариации на практике используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Если данный показатель не превышает 0,333, или 33,3%, вариация признака считается слабой, а если больше 0,333 - сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина – нетипичной, поэтому ее нельзя использовать как обобщающий показатель этой совокупности. Нижним пределом коэффициента вариации считается ноль, верхнего предела не существует. Однако вместе с увеличением вариации признака увеличивается и его значения.

При расчете коэффициента вариации вам придется использовать среднее квадратическое отклонение. Оно определяется как квадратный корень из дисперсии, которую в свою очередь вы можете найти следующим образом: Д = Σ(Х-Хср)^2/N. Иными словами дисперсия – это средний квадрат отклонения от среднего арифметического значения. Среднее квадратическое отклонение определяет, насколько в среднем отклоняются конкретные показатели ряда от их среднего значения. Оно является абсолютной мерой колеблемости признака, а потому четко интерпретируется.

Рассмотрите пример расчета коэффициента вариации. Расход сырья на единицу продукции, произведенной по первой технологии, составляет Хср=10 кг, при среднем квадратическом отклонении σ1=4, по второй технологии – Хср=6 кг при σ2= 3. При сравнении среднего квадратического отклонения можно сделать неверный вывод о том, что вариация расхода сырья по первой технологии интенсивнее, чем по второй. Коэффициенты вариации V1=0,4 или 40% и V2=0,5 или 50% позволяют сделать противоположный вывод.

Относительные показатели предназначены для того, чтобы характеризовать интенсивность происходящих изменений измеряемой величины. Для их нахождения надо знать абсолютные значения как минимум в двух точках измерений - например, на двух отметках временной шкалы. Поэтому относительные показатели считаются вторичными по отношению к абсолютным, но тем не менее, без них трудно оценить общую картину изменений, происходящих с измеряемым параметром.

Инструкция

Делите один абсолютный показатель на другой, чтобы получить значение относительного показателя, характеризующее произошедшие изменения абсолютных показателей. В числитель следует ставить тот абсолютный показатель, который является текущим (или «сравниваемым»), а в знаменателе должен быть абсолютный показатель, с которым сравнивается текущее значение - он называется «основанием» или «базой сравнения». Результат деления (то есть относительный показатель) будет выражать, во сколько раз текущий абсолютный показатель больше базисного или сколько единиц текущего значения приходится на каждую единицу базового.

Если сравниваемые абсолютные величины имеют одинаковые единицы измерения (например, количество произведенных гаубиц), то полученный в результате расчетов относительный показатель, как правило, выражается в процентах, промилле, продецимилле или в коэффициентах. В коэффициентах относительный показатель выражают в том случае, если базовый абсолютный показатель принимают равным единице. Если единицу заменить сотней, то относительный показатель будет выражен в процентах, если миллионом - в промилле, а если десятью миллионами - в продецимилле. Когда сравнивают две величины, имеющие разные единицы измерения (например, гаубицы и численность населения страны), полученный относительный показатель выражается в именованных величинах (например, гаубиц в расчете на душу населения).

Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.

В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.

Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:

Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):

Примеры применения данных формул представлены в задачах 1 и 2.

Широко распространенным на практике показателем является среднее квадратическое отклонение :

Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.

Формула для расчета коэффициента вариации.

Примеры решения задач по теме «Показатели вариации в статистике»

Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:

Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.

Решение

1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).

Средний размер вклада найдем по формуле средней арифметической взвешенной:

29 000/50 = 580 руб.

Дисперсию вклада найдем по формуле:

23 400/50 = 468

Аналогичные действия произведем для банка без рекламы :

2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.

3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.

4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.

5) Определим общую дисперсию, используя правило сложения.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04

6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.

7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.

Задача 2 . Имеется группировка предприятий по величине товарной продукции:

Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.

Решение

1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).

В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).

Расчет средней величины товарной продукции делаем по формуле:

Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:

Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.

2) Дисперсию найдем по следующей формуле:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.

4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Из всех показателей вариации среднеквадратическое отклонение в наибольшей степени используется для проведения других видов статистического анализа. Однако среднеквадратическое отклонение дает абсолютную оценку меры разбросанности значений и чтобы понять, насколько она велика относительно самих значений, требуется относительный показатель. Такой показатель называется он коэффициент вариации .

Формула коэффициента вариации:

Данный показатель измеряется в процентах (если умножить на 100%).

В статистике принято, что, если коэффициент вариации

меньше 10%, то степень рассеивания данных считается незначительной,

от 10% до 20% - средней,

больше 20% и меньше или равно 33% - значительной,

значение коэффициента вариации не превышает 33%, то совокупность считается однородной,

если больше 33%, то – неоднородной.

Средние, рассчитанные для однородной совокупности – значимы, т.е. действительно характеризуют эту совокупность, для неоднородной совокупности – незначимы, не характеризуют совокупность из-за значительного разброса значений признака в совокупности.

Возьмем пример с расчетом среднего линейного отклонения.

И график для напоминания


По этим данным рассчитаем: среднее значение, размах вариации, среднее линейное отклонение, дисперсию и стандартное отклонение.

Среднее значение – это обычная средняя арифметическая.

Размах вариации – разница между максимумом и минимумом:

Среднее линейное отклонение считается по формуле:

Дисперсия считается по формуле:

Среднеквадратическое отклонение – квадратный корень из дисперсии:

Расчет сведем в табличку.

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

    Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.

    Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.

    Дисперсия – средний квадрат отклонений.

    Среднеквадратическое отклонение – корень из дисперсии (среднего квадрата отклонений).

    Коэффициент вариации – наиболее универсальных показатель, отражающий степень разбросанности значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

В продолжение темы:
Linux

Социальная сеть «Фотострана» многим не нравится своей навязчивостью, что также проявляется, когда пользователь желает удалить свой аккаунт. В самой сети есть подводные камни,...

Новые статьи
/
Популярные