Мода (Мо) – это наиболее распространенное значение признака, т.е. варианта, которая в ряду распределения имеет наибольшую частоту.
В дискретном ряду мода определяется визуально. На основании таблицы 4 можно утверждать, что Мо=676,77р. (2001г), т.к. 2001г самый большой валовой сбор яиц.
Медиана (Ме) – варианта, которая расположена в середине упорядоченного ряда распределения и делит ряд на две равные по объему части.
Медиана, как и мода не зависит от крайних значений вариантов, поэтому применяется для характеристики центра в ряду распределения с неопределенными границами.
В дискретном ряду медианой будет значение признака, для которого кумулятивная частота (Sm) равна или превышает половину объема совокупности. Объем совокупности, если судить по таблице 4, равен 3571543тыс.шт., его половина равна 1785771,5 тыс.шт. Кумулятивная частота 1998 года (Sm=2175156) превышает и максимально близка к этой цифре. Значит, медианой является себестоимость 1998 года и равняется Ме=530,11р. Следовательно, кумулятивная частота определяет, что валовой сбор, равный 1785771,5 тыс.шт., будут иметь себестоимость в среднем 530,11р.
Коэффициент асимметрии равняется:
, где - средняя величина; - мода; - среднее квадратическое отклонение. значит, имеется сильная левосторонняя асимметрия.Показатели вариации
Вариация – различия в значениях какого-либо признака. Средняя величина дает только обобщающую характеристику совокупности, но не раскрывает строение совокупности, т.е. не показывает, как располагаются около средней варианты усредняемого признака. Для измерения и оценки вариации используются абсолютные (вариационный размах, среднее линейное и квадратическое отклонения, дисперсии) и относительные (коэффициенты вариации, неравномерности, локализации, концентрации) характеристики.
Вариационный размах (R) – характеризует диапазон вариации:
Среднее линейное отклонение:
Среднее квадратическое отклонение:
Дисперсия:
На основании среднего квадратического отклонения получим коэффициент вариации:
Себестоимость отклоняется от совокупности на 207,70р. или на 58,88%.
3.4. Корреляционно-регрессионный анализ
Корреляционный и регрессионный методы решают две основные задачи:
1. Определение с помощью уравнений регрессии аналитической формы связи между вариацией признаков х и у;
2. Установление меры тесноты связи между признаками (в какой мере вариация х обусловливает вариацию у).
Путем построения и анализа регрессионных моделей можно ответить на вопрос, как каждый фактор влияет на изучаемое явление. Корреляционный и регрессионный методы дают возможность количественно исследовать влияние факторов на изучаемое явление. Современные статистики широко используют метод корреляции. Он выступает как источник теоретических знаний. Между тем применение его без заранее обусловленной цели и качественного анализа нередко приводит к ошибочным выводам.
Для того чтобы корреляционный метод способствовал изучению сущности явлений, необходимо, чтобы исследователь владел не только этим методом, но и предметом своего исследования.
Понятие корреляционной зависимости является частным случаем более общего понятия – зависимости стохастической. Переменная у находится в стохастической зависимости от х, если каждому значению х соответствует ряд распределения у и с изменением х эти ряды закономерно изменяются. Если же они не изменяются или изменяются случайно, то у стохастически не зависит от х.
Основная задача изучения корреляционных связей состоит в отыскании причин исследуемого явления, события, факта. Факторный признак выступает как признак-причина, а результативный – как признак-следствие.
Корреляционный метод анализа включает в себя несколько этапов:
1. Постановка задачи и выбор факторных и результативных признаков;
2. Сбор статистического материала, его проверка;
3. Предварительное изучение взаимосвязей с помощью графиков и аналитических группировок;
4. Изучение парных зависимостей;
5. Исследование многофакторной зависимости;
6. Оценка результатов исследования, пояснение и анализ.
Степень тесноты связи характеризуется количественными оценками, а направление связи знаками у коэффициента корреляции (таблица 11).
Таблица 11. Количественные критерии оценки тесноты связи.
Величина коэффициента корреляции | Характер связи |
До |±0,3| | Практически отсутствует |
От |±0,3| до |±0,5| | Слабая |
От |±0,5| до |±0,7| | Средняя |
Свыше |±0,7| | Сильная (высокая) |
Для начала изучим связь между затратами на оплату труда и себестоимостью. Значение факторного признака - затраты на оплату труда (
) располагается по ранжиру (таблица 12), себестоимость – y.Таблица 12. Ранжированный ряд по затратам
y | Год | |
7,73 | 68,56 | 1992 |
8,40 | 71,23 | 1993 |
9,56 | 75,02 | 1994 |
12,56 | 530,11 | 1998 |
12,84 | 186,63 | 1995 |
13,41 | 246,41 | 1996 |
14,24 | 391,22 | 1997 |
14,26 | 484,14 | 1999 |
15,38 | 342,23 | 2000 |
18,91 | 676,77 | 2001 |
В среднем наблюдается прямолинейная прямая зависимость, т.е. увеличение затрат на заработную плату приводит к увеличению себестоимости.
Результативный и факторный признаки изменяются одинаково, значит, мы имеем дело с линейной связью.
Далее строим корреляционное поле, приведенное на рисунке 1, для определения направления и аналитического выражения связи между
и y.На оси абсцисс наносим значения факторного признака (
), а на оси ординат – результативного (y), а по данным таблицы 12 все единицы, обладающие определенными значениями и y.Рис.1. Связь между затратами на заработную плату и себестоимостью яйца
Соединив полученные на пересечении
и y точки прямыми линиями, получим статистическую ломанную регрессии (рис.1). Ломанная позволяет судить о форме связи, об аналитическом ее выражении.Корреляционное поле на рис.1 показывает прямолинейную и прямую связь между затратами на заработную плату и себестоимостью яиц. Аналитически связь между факторными и результативными признаками описывается уравнением прямой
.Для определения параметров
и в уравнении прямой данные приводятся в таблице 13.Таблица 13 Расчеты параметров уравнения
Год | Затраты на оплату труда, р. | Себестоимость, р. | Для изучения связи | ||||
y | Ранжир по фактору | y=-268,28+ | |||||
1992 | 7,73 | 68,56 | 59,75 | 4700,47 | 529,97 | 7,73 | 73,93 |
1993 | 8,4 | 71,23 | 70,56 | 5073,71 | 598,33 | 8,40 | 103,59 |
1994 | 9,56 | 75,02 | 91,39 | 5628,00 | 717,19 | 9,56 | 154,94 |
1995 | 12,84 | 186,63 | 164,87 | 34830,76 | 2396,33 | 12,56 | 287,75 |
1996 | 13,41 | 246,41 | 179,83 | 60717,89 | 3304,36 | 12,84 | 300,15 |
1997 | 14,24 | 391,22 | 202,78 | 153053,09 | 5570,97 | 13,41 | 325,38 |
1998 | 12,56 | 530,11 | 157,75 | 281016,61 | 6658,18 | 14,24 | 362,12 |
1999 | 14,26 | 484,14 | 203,35 | 234391,54 | 6903,84 | 14,26 | 363,01 |
2000 | 15,38 | 342,23 | 236,54 | 117121,37 | 5263,50 | 15,38 | 412,59 |
2001 | 18,91 | 676,77 | 357,59 | 458017,63 | 12797,72 | 18,91 | 568,87 |
Всего | 127,29 | 3072,32 | 1724,41 | 1354551,08 | 44740,39 | 127,29 | 2952,33 |
Определим параметры
и , для этого необходимо решить систему уравнений относительно и :