Наиболее простым и достаточно точно отображающим действительность (в подавляющем большинстве случаев) является так называемый нормальный закон распределения ошибок.
Этот закон распределения может быть получен из различных теоретических предпосылок, в частности, из требования, чтобы наиболее вероятным значением неизвестной величины, для которой непосредственным измерением получен ряд значений с одинаковой степенью точности, являлось среднее арифметическое этих значений. Величина 2 называется дисперсией данного нормального закона.
Определим дисперсию как среднюю взвешенную (
): (20)Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического. В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле (
): (21)Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического.
Определим коэффициент вариации (
): (22)Чем больше значение коэффициента вариации, тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений.Из полученных расчетов можно сделать вывод. Так, образованное СКО и дисперсия являются не типичными и не достоверными показателями, так как коэффициент вариации превышает 33% и так как минимальная урожайность – 7,0 ц/га, а максимальная – 30,9 ц/га.
При рассмотрении нормального закона распределения выделяется важный частный случай, известный как правило трех сигм. Правило 3-х сигм (3s) — практически все значения нормально распределённой случайной величины лежат в интервале. Более строго — не менее чем с 99,7% достоверностью, значение нормально распределенной случайной величины лежит в указанном интервале. При условии, что величина истинная, а не полученная в результате обработки выборки. Если же истинная величина неизвестна, то следует пользоваться не σ, а s. Таким образом, правило 3-х сигм преобразуется в правило трех s[4].
Используя правило 3
для определения величины интервала посредством группировки, определим влияние урожайности подсолнечника на уровень рентабельности.Таблица 8 – Интервальный ряд распределения предприятий по урожайности по правилу 3
№ группы | Нижняя граница | Верхняя граница | Число х-в | ||
формула | значение | формула | значение | ||
1 | -2,54 | 3,56 | 0 | ||
2 | 3,56 | 9,66 | 4 | ||
3 | 9,66 | 15,76 | 9 | ||
4 | 15,76 | 21,86 | 5 | ||
5 | 21,86 | 27,96 | 4 | ||
6 | 27,96 | 34,06 | 1 | ||
Итого | - | - | - | - | 23 |
При построении по правилу 3
всегда образуется шесть групп предприятий. Так как в первую группу не вошло ни одно предприятие, то ее целесообразно объединить со второй, а, кроме того, пятую с шестой. Таким образом, мы имеем четыре группы предприятий, которые представлены в следующей таблице:Таблица 9 – Интервальный ряд распределения предприятий по урожайности подсолнечника по группам предприятий в изучаемой совокупности предприятий
Группы предприятий | Число предприятий | Группы значений по урожайности |
1 | 4 | До 9,66 |
2 | 9 | 9,66-15,76 |
3 | 5 | 15,76-21,86 |
4 | 5 | 21,86-34,06 |
- | 23 | - |
По полученным группам определим сводные и обобщающие показатели, рассчитаем уровень рентабельности по каждой группе предприятий и их оформим их в виде таблицы (см.приложение 5).
Важнейшим фактором и путём повышения экономической рентабельности производства продукции растениеводства является дальнейшее увеличение урожайности сельскохозяйственных культур. Увеличение урожайности оказывает влияние не только на увеличение валовых сборов зерна, но и на экономическую эффективность его производства: производительность труда, себестоимость, а, следовательно, и на рентабельность.
Рост урожайности масличных культур, как правило, связан с дополнительными трудовыми и материальными затратами на их возделывание (в расчёте на гектар посева). Однако как показывают практические исследования темпы роста урожайности и дополнительных затрат неодинаковы – урожайность растёт быстрее, чем дополнительные затраты труда и средств. Поэтому с ростом урожайности сокращается трудоёмкость производства, снижается себестоимость подсолнечника и повышается уровень рентабельности.
Так как в полученных расчетах не выявлена яркая зависимость рентабельности от урожайности (в четвертой группе уровень рентабельности снизился, а урожайность увеличилась), проведем вторичную группировку хозяйств, объединив третью и четвертую группы. Полученные данные оформим в таблицу (см.приложение 7).
Таким образом, проведя вторичную группировку предприятий, ярко выслеживается тенденция зависимости уровня рентабельности от урожайности. С повышением урожайности по каждой группе предприятий мы наблюдаем увеличение уровня рентабельности. Если сравнивать эффективность производства культуры по каждой группе, то можно сделать вывод о том, что все три группы предприятий оказались прибыльными, так как повышение урожайности и рентабельности идет пропорционально, однако, третья группа предприятий с повышением урожайности до 20,1 ц/ га увеличила уровень рентабельности всего на 1,7% по сравнению со второй группой, в то время как урожайность второй группы равна 13, 9 ц/га. В целом можно отметить, группировка выявила заметную тенденцию движения уровня рентабельности, что и было целью данного исследования.
Дисперсионный анализ (от латинского Dispersio – рассеивание) – статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др[11].
Целью дисперсионного анализа является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации.
В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора называется уровнем фактора или способом обработки.
В зависимости от количества факторов, определяющих вариацию результативного признака, дисперсионный анализ подразделяют на однофакторный и многофакторный.
В моем курсовом проекте для оценки существенной зависимости, обнаруженной методом группировки применяется однофакторный дисперсионный анализ влияния урожайности подсолнечника на рентабельность производства культуры.
При изучении явлений и процессов общественной жизни статистика встречается с разнообразной вариацией (изменчивостью) признаков, характеризующих отдельные единицы совокупности.
Вариация - это различие в значениях, какого - либо признака у разных единиц данной совокупности в один и тот же момент времени. Величины признаков изменяются под действием различных факторов. И, следовательно, чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация. Исследование вариации в статистике имеет большое значение, т. к. помогает изучить сущность явления.