Или
Средняя геометрическая применяется в основном при расчётах средних темпов роста.
2.5 Мода и медиана
Наряду с рассмотренными выше средними в качестве статистических характеристик вариационных рядов рассчитываются так называемые структурные средние - мода и медиана.
Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности. Для дискретных рядов - этот вариант, имеющий наибольшую частоту.
В интервальных вариационных рядах можно определить, прежде всего, интервал, в котором находится мода, т.е. так называемый модальный интервал. В вариационном ряду с равными интервалами модальный интервал определяется по наибольшей частоте, в рядах с неравными интервалами по наибольшей плотности распределения.
Для определения моды в рядах с равными интервалами пользуются формулой следующего вида:
где:
Хн - нижняя граница модального интервала,
h - величина интервала,
f1, f2, f3 - частоты (или частности) соответственно предмодального, модального и послемодального интервалов.
В интервальном ряду моду можно найти графически. Для этого в самом высоком столбце гистограммы от границ двух смежных столбцов проводят две линии. Затем из точки их пересечения опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее перпендикуляру, и будет модой.
Во многих случаях при характеристике совокупности в качестве обобщённого показателя отдаётся предпочтение моде, а не средней арифметической.
Так, при изучении цен на рынке фиксируется и изучается в динамике не средняя цена на определённую продукцию, а модальная; при изучении спроса населения на определённый размер обуви или одежды представляет интерес определение модального размера обуви, а средний размер как таковой здесь вообще не имеет значения. Мода представляет не только самостоятельный интерес, но и исполняет роль вспомогательного показателя при средней, характеризуя её типичность. Если средняя арифметическая близка по значению к моде, значит она типична.
Медианой (Ме) называется значение признака у средней единицы ранжированного ряда. (Ранжированным называют ряд, у которого значения признака записаны в порядке возрастания или убывания.)
Чтобы найти медиану, сначала определяется её порядковый номер. Для этого при нечётном числе единиц к сумме всех частот прибавляется единица, и всё делится на два. При чётном числе единиц в ряду будет две средних единицы, и по всем правилам медиана должна определяться как средняя из значений этих двух единиц. Однако практически при чётном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер которой определяется по общей сумме частот, делённой на два. Зная порядковый номер медианы, легко по накопленным частотам найти её значение.
В интервальных рядах после определения порядкового номера медианы по накопительным частотам (частностям) отыскивается медиальный интервал, а затем при помощи простейшего интерполяционного приёма определяется значение самой медианы. Этот расчёт выражает следующая формула:
где:
Xn- нижняя граница медианного интервала,
h - величина медианного интервала,
- порядковый номер медианы,SMe- 1 частота (частотность), накопленная до медианного интервала,
FMe- частота (частность) медианного интервала.
Согласно записанной формуле к нижней границе медианного интервала прибавляется такая часть величины интервала, которая приходится на долю единиц этой группы, недостающих до порядкового номера медианы. Другими словами, расчёт медианы построен на предположении, что нарастание признака среди единиц каждой группы происходит равномерно. На основе сказанного можно рассчитать медиану и по иному. Определив медианный интервал, можно из верхней границы медианного интервала (Хв) вычесть ту часть интервала, которая приходится на долю единиц, превышающих порядковый номер медианы, т.е. по следующей формуле:
Медиану можно также определить и графически. Для этого строиться кумулята и из точки на шкале накопленных частот (частностей), соответствующей порядковому номеру медианы, проводится прямая, параллельная оси х до пересечения с кумулятой. Затем из точки пересечения указанной прямой с куммулятой опускается перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее проведённой ординате (перпендикуляру), и будет медианой.
По такому же принципу легко найти значение признака у любой единицы ранжированного ряда.
Таким образом, для расчёта средней величины вариационного ряда можно использовать целую совокупность показателей.
3. Основные показатели вариации и их значение в статистике
При изучении варьирующего признака у единиц совокупности нельзя ограничиваться лишь расчётом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям. Это можно проиллюстрировать следующим условным примером, отражающим данные о числе дворов в агрохозяйствах двух районов:
Среднее число дворов в агрохозяйствах двух районов одинаково - 160. Однако состав этих агрохозяйств в двух районах далеко не одинаков. Поэтому возникает необходимость измерить вариацию признака в совокупности.
Для этой цели в статистике рассчитывают ряд характеристик, т.е. показателей. Самым элементарным показателем вариации признака является размах вариацииR, представляющий собой разность между максимальными и минимальными значениями признака в данном вариационном ряду, т.е. R = Xmax - Xmin. В нашем примере в 1 районе R = 300 - 80 - 220, а во втором районе R = 180 - 145 = 35.
Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц. Иногда находят отношение размаха вариации к средней арифметической и пользуются этой величиной, именуя её показателем осцилляции.
Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической. Таких показателей в статистике два - среднее линейное и среднее квадратическое отклонение.
Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных величин отклонений вариантов от средней. Знаки отклонений в данном случае игнорируются, в противном случае сумма всех отклонений будет равна нулю. Данный показатель рассчитывается по формуле:
а) для несгрупированных данных:
б) для вариационного ряда:
Следует иметь в виду, что среднее линейное отклонение будет минимальным, если отклонения рассчитаны от медианы, т.е. по формуле:
Среднее квадратическое отклонение (s) исчисляется следующим образом - каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учётом весов), после чего сумма квадратов делиться на число членов ряда и из частного извлекается корень квадратный.
Все данные действия выражаются следующими формулами:
а) для несгрупированных данных:
б) для вариационного ряда:
f, т.е. среднее квадратическое отклонение предятавляет собой корень квадратный из средней арифметической квадратов отклонений средней. Выражение под корнем носит название дисперсии. Дисперсия имеет самостоятельное выражение в статистике и относится к числу важнейших показателей вариации.