Когда количество вариантов в ряду четное число, медианой считают один из тех вариантов, который по своей величине мог бы находиться посередине между вариантами с номером
и . Так, если бы в цехе был еще и восьмой рабочий с заработной платой в 276 руб., то медиана находилась бы посередине между четвертым и пятым порядковыми номерами. В таких случаях принято считать, что в промежутке между номерами и идет равномерное нарастание или убывание вариантов. Поэтому за медиану принимают среднюю арифметическую из вариантов с номерами и . В данном примереСмысл полученного результата такой: одна половина рабочих получила за месяц меньше, а другая — больше 167,5 руб.
Следовательно, медиана — обобщающий показатель распределения совокупности, уровень признака, который делит совокупность на две равные части, и представляет обычно интерес в анализе, как это видно из приведенного примера.
Медиана, в отличие от средней, не является абстрактной величиной. Она находится точно в середине ряда, представляет собой реальное значение признака, соответствует определенному варианту и при этом наиболее точна в случае нечетного числа членов совокупности. Медиана как обобщающая характеристика совокупности не может, однако, заменить среднюю. Медиана — это центр распределения численности единиц совокупности, а средняя — центр распределения отклонений значений признака от равнодействующей. Величина медианы определяется лишь одним или двумя серединными значениями признака. Изменения всех остальных величин, если они не меняют последовательности членов в центре ряда, не находят отражения в медиане. Так, если месячную заработную плату наименее оплачиваемых двух рабочих поднять на 40 руб., это не скажется на медиане, несмотря на то, что тем самым значительно повышаются доходы двух рабочих цеха и существенно выравнивается заработная плата членов коллектива. Поэтому медиана, представляющая определенный интерес в анализе, не может заменить среднюю, которая при замене реального коллектива абстрактным коллективом с уравненными значениями признака оставляет неизменным определяющий показатель совокупности.
Медианой целесообразно пользоваться, когда не известны границы открытых крайних интервалов вариационного ряда, на которые приходится значительная часть единиц всей совокупности, так как средняя в этих случаях страдает значительной неточностью. При исчислении же медианы отсутствие сведений об этих границах не влияет на точность расчета.
2.2.2 Мода
Мода (Мо) - это вариант признака, который при данном сочетании причин разного порядка чаще всего встречается в вариационном ряду. Например, цена, по которой чаще всего реализуется данный товар на рынке, является модой или модальной ценой. Месячная заработная плата, которая чаще всего встречается в данном коллективе, является для него модальной заработной платой.
Мода - типичная величина, в том смысле, что она встречается в совокупности или объективно может встретиться чаще других. Она имеет важное значение для решения некоторых задач, например какой высоты должны быть предназначенные для массового потребления станки, столы и т. п., какое количество детей чаще всего встречается в семье, какое время дня является «пиковым» для работы предприятий общественного питания, электростанций, городского транспорта и др., какой уровень выполнения плана наиболее часто встречается в том или ином коллективе рабочих или предприятий и т. п.
Мода соответствует определенному значению признака. На практике моду находят, как правило, по сгруппированным данным.
В дискретном ряду мода определяется без вычисления как значение признака с наибольшей частотой.
В интервальном вариационном ряду, тем более при непрерывной вариации признака, строго говоря, каждое значение признака встречается только один раз. Модальным интервалом является интервал с наибольшей частотой. Внутри этого интервала находят условное значение признака, вблизи которого плотность распределения, то есть число единиц совокупности, приходящееся на единицу измерения варьирующего признака, достигает максимума. Это условное значение и считается точечной модой. Логично предположить, что такая точечная мода располагается ближе к той из границ интервала, за которой частота в соседнем интервале больше частоты в интервале за другой границей модального интервала. Отсюда имеем обычно применяемую формулу:\
,XMo - нижнее значение признака Xв модальном интервале;
i - величина интервала;
fMo-частота (частость) повторения признака Xв модальном интервале;
fMo-1 ,fMo+1 - соответственно частоты (частости) признака для интервала, предшествующего модальному и следующего за ним.
Пример: Таблица 2.2.2
Удойность в среднем от одной коровы за год, кг | Процент хозяйств |
До 1000 | 7,6 |
1000-1649 | 9,7 |
1650-1999 | 16,1 |
2000-2499 | 37,5 |
2500-2999 | 20,6 |
3000-3999 | 8,2 |
4000 и выше | 0,3 |
100 |
По табл.2.2.2. модальный интервал составляет 2000 - 2499шт, так как ему соответствует наибольшая частота 37,5%, нижняя его граница хо = 2000, а величина интервала h = 500. Следовательно,
Это значит, что чаще всего встречаются хозяйства, у которых надой в среднем от одной коровы составляет 2280 кг.
Для решения практических задач наибольший интерес представляет обычно мода, выраженная в виде интервала, а не дискретным числом. Объясняется это назначением моды, которая должна выявить наиболее распространенные размеры явления. Выраженная в виде дискретного числа мода часто не отвечает этому требованию. Так, в нашем примере процент хозяйств, у которых годовой надой в среднем на одну корову составляет 2280 кг, хотя и больше, чем хозяйств с любым другим уровнем надоя, но сам по себе он может быть небольшим. Хозяйств же с удойностью в пределах интервала 2000 - 2499 кг - 37,5%, а 2000 - 3000 кг - 58,1, - т. е. весьма значительный процент.
3. Основные методологические требования расчета средних величин
В связи с тем, что различные виды средних приводят кразным результатам, возникает проблема правильного выбора формы средней. Если форма выбрана неправильно, то средняя будет завышена либо занижена. Так как любая средняя рассчитана на отображение лишь одного какого-либо конкретного свойства совокупности, то, следовательно, ответ может быть только однозначным. Кроме того, каждая средняя имеет свой особый смысл и область применения.
Рассматривая вопрос о выборе формы средней, которая наилучшим образам отвечает требованиям, К. Джини пишет: «Для выбора такой средней можно наметить лишь общие нормы, решающую же роль здесь играет интуиция и искусство исследователя»[1]. Как, однако, ни важны эти качества исследователя, как и общие соображения об особенностях различных средних и их назначении, решающим в выборе формы средней является социально-экономическое содержание явления, сущность которого должна найти свое количественное выражение в средней. Средняя должна, на основе обобщения количественной стороны массовых общественный явлений в неразрывной связи с их качественной стороной, дать ответ на конкретные вопросы, выдвигаемые жизнью. Поэтому для правильного решения вопроса о выборе формы средней необходимо прежде всего учесть сущность объекта, законы его развития, его специфику, определить задачу, которая должна решаться при помощи средней, и исходя из всего этого установить определяющий показатель, который должен найти отражение в средней. Таков первый этап в решении вопроса о форме средней.
Второй этап в выборе формы средней заключается в определении характера связи между определяющим свойством и осредняемым признаком. Если, например, связь прямо пропорциональна, то для расчета средней надо воспользоваться формулой средней арифметической, а при обратной пропорциональности — формулой средней гармонической. В случаях, когда связь выражается в форме геометрической прогрессии, средняя должна исчисляться по формуле средней геометрической и т. п.
Третий этап практически сводится к исчислению числовых значений средней по избранной формуле на основе фактических данных.
Из всех трех этапов наиболее сложным является первый. Недоучет некоторых обстоятельств на этом этапе или формальный подход, оторванный от качественного анализа, приводит нередко к тому, что разные авторы предлагают для решения одной и той же задачи разные виды средних.
Так как средние, включая и распределительные средние, привлекаются для получения типичных характеристик совокупности, то выбор формы средней для решения той или иной задачи зависит и от того, о какой типичности идет речь. Для характеристики однородности совокупности, устойчивости или изменчивости явлений и процессов следует привлекать среднее линейное отклонение, среднее квадратическое отклонение и коэффициент вариации. В тех случаях, когда для решения той или иной задачи важно знать размер признака, который чаще всего встречается в совокупности, надо пользоваться модой, а для того, чтобы установить границу между высшей и низшей группами величин, а также для решения некоторых оптимальных задач, — медианой. Так как различные виды средней по-разному характеризуют совокупность, то для всестороннего ее изучения надо сочетать различные виды средних величин.