Смекни!
smekni.com

Статистический анализ производства зерна, сахарной свеклы, подсолнечника (стр. 7 из 9)

Таблица 6. Исходные данные по группам

Группа предприятий по урожайности ц/га (Х) Номер предприятия Валовой сбор, ц. Площадь посева, га Себестоимость произведенной продукции Уровень интенсификации, тыс. руб. Число предприятий, ед.
1 2 3 4 5 6 7
Границы групп
13.2 - 18.1 21 21049.8 1594 1604151 1007
1 12027.4 781 1438958 1841
6 10696.6 677 2064444 3047
18 19057 1121 2285315 2045
10 36523.8 2064 6035949 2882
20 28729.2 1614 298688 1856
Итого по 1 группе 128083.8 7851 13727505 12678 6
18.1 - 23 17 30258.9 1601 3017720 1888
8 30511.8 1541 5636140 3832
4 19820.4 996 3246978 3264
9 33640 1682 6505640 3308
14 29936.4 1482 1635426 1103
7 23649.5 1165 4564354 3743
15 24840 1200 2989742 2488
11 36485.5 1697 5549080 3264
16 40918.6 1877 6286325 358
Итого по 2 группе 270061.1 13241 39431405 23248 9
23 - 27.9 19 18008.2 677 3383921 4993
2 30690 1100 4969325 4526
Итого по 3 группе 48698.2 1777 8353246 9519 2
27. 9 - 32.8 5 22226.4 756 3297953 4365
3 126387 4185 30067467 7184
13 23759.5 779 4275997 5489
Итого по 4 группе 172372.9 5720 37641417 17038 3
32.8 - 37.7 12 50970.4 1352 13165654 9742
Итого по 5 группе 50970.4 1352 13165654 9742 1
Итого 670186.4 29941 112319227 72225 21

Таблица 7. Аналитическая группировка сельскохозяйственных предприятий по урожайности

Группа предприятий по урожайности ц/га (Х) Количество предприятий, ед. Себестоимость 1 ц., руб. Урожайность, ц/га Уровень интенсификации, тыс. руб.
А 1 2 3 4
Границы групп
13.2 - 18.1 6 107175.96 16.31 2113
18.1 - 23 9 146009.19 20.39 2583.11
23 - 27.9 2 171530.89 27.4 4759.5
27. 9 - 32.8 3 218372.01 30.13 5679.33
32.8 - 37.7 1 258299.99 37.7 9742
В среднем по совокупности предприятий 180277.608 26.386 4975.388

Таким образом, между урожайностью и себестоимостью 1 ц. зерна (сахарной свеклы, подсолнечника) существует прямая связь, т. е. повышение урожайности на 25 % даёт повышение себестоимости на 38833,23 руб.


4.Корреляционно-регрессионный анализ

4.1 Сущность и основные условия применения корреляционного анализа

В соответствии с сущностью корреляционной связи ее изучение имеет две цели:

1) измерение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков);

2) измерение тесноты связи двух (или большего числа) признаков между собой.

Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнения связи является метод наименьших квадратов (МНК), разработанный К. Ф. Гауссом (1777-1855). Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной у от ее значений, вычисленных по уравнению связи с факторным признаком (многими признаками) х. [5, с. 78]

Для измерения тесноты связи применяется несколько показателей. При парной связи теснота связи измеряется прежде всего корреляционным отношением, которое обозначается греческой буквой η. Квадрат корреляционного отношения - это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий. Квадрат корреляционного отношения называется коэффициентом детерминации:

(28)

где k - число групп по факторному признаку;

N — число единиц совокупности;

уi — индивидуальные значения результативного признака;

i - его средние групповые значения;

- его общее среднее значение;

fi - частота в j-й группе.

Формула (1) применяется при расчете показателя тесноты связи по аналитической группировке. При вычислении корреляционного отношения по уравнению связи (уравнению парной или множественной регрессии) применяется формула (2):

(29)

где

- индивидуальные значения у по уравнению связи.

Сумма квадратов в числителе - это объясненная связью с фактором х (факторами) дисперсия результативного признака у. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии. [11, с. 300]

Если уравнение выбрано неверно или сделана ошибка при расчете его параметров, то сумма квадратов в числителе может оказаться большей, чем в знаменателе, и отношение утратит тот смысл, который оно должно иметь, а именно какова доля общей вариации результативного признака, объясняемая на основе выбранного уравнения связи его с факторным признаком (признаками). Чтобы избежать ошибочного результата, лучше вычислять корреляционное отношение по другой формуле (3), не столь наглядно выявляющей сущность показателя, но зато полностью гарантирующей от возможного искажения:

(30)

В числителе формулы (3) стоит сумма квадратов отклонений фактических значений признака у от его индивидуальных расчетных значений, т.е. доля вариации этого признака, не объясняемая за счет входящих в уравнение связи признаков-факторов. Эта сумма не может стать равной нулю, если связь не является функциональной. При неверной формуле уравнения связи или ошибке в расчетах возрастают расхождения фактических и расчетных значений, и корреляционное отношение снижается, как логически и должно быть.

В основе перехода от формулы (2) к формуле (3) лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:

Dобщ=Dмежгр+Dвнутригр

Согласно этому правилу можно вместо межгрупповой (факторной) дисперсии использовать разность:

Dобщ - Dвнутригр

что дает:

(31)

При расчете η не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу (3). В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как

Dобщ=Dобъяснуравнрегр+Dост

Важнейшее положение, которое следует теперь усвоить любому, желающему правильно применять метод корреляционно-регрессионного анализа, состоит в интерпретации формул (2) и (3). Это положение гласит:

Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака (признаков). Меры тесноты связи измеряют долю вариации результативного признака.

Интерпретировать корреляционные показатели строго следует лишь в терминах вариации (различий в пространстве) отклонений от средней величины. Если же задача исследования состоит в измерении связи не между вариацией двух признаков в совокупности, а между изменениями признаков объекта во времени, то метод корреляционно-регрессионного анализа требует значительного изменения. [15, с. 145]

Из вышеприведенного положения об интерпретации показателей корреляции следует, что нельзя трактовать корреляцию признаков как связь их уровней. Это ясно хотя бы из следующего примера. Если бы все крестьяне области внесли под картофель одинаковую дозу удобрений, то вариация этой дозы была бы равна нулю, а следовательно, она абсолютно не могла бы влиять на вариацию урожайности картофеля. Параметры корреляции дозы удобрений с урожайностью будут тогда строго равны нулю. Но ведь и в этом случае уровень урожайности зависел бы от дозы удобрений - он был бы выше, чем без удобрений.

Итак, строго говоря, метод корреляционно-регрессионного анализа не может объяснить роли факторных признаков в создании результативного признака. Это очень серьезное ограничение метода, о котором не следует забывать.

Следующий общий вопрос - это вопрос о «чистоте» измерения влияния каждого отдельного факторного признака. Группировка совокупности по одному факторному признаку может отразить влияние именно данного фактора на результативный признак при условии, что все другие факторы не связаны с изучаемым, а случайные отклонения и ошибки взаимопогасились в большой совокупности. Если же изучаемый фактор связан с другими факторами, влияющими на результативный признак, будет получена не «чистая» характеристика влияния только одного фактора, а сложный комплекс, состоящий как из непосредственного влияния фактора, так и из его косвенных влияний, через его связь с другими факторами и их влияние на результативный признак. Данное положение полностью относится и к парной корреляционной связи.