Внутригрупповые дисперсии по каждой группе:
Средняя из внутригрупповых дисперсий:
Вычислим межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешенную из групповых средних:
Межгрупповая дисперсия:
Общая дисперсия по правилу сложения дисперсий:
Эмпирическое корреляционное отношение:
Величина эмпирического корреляционного отношения, равная 0,60, характеризует связь между группировочным и результативным признаками.
Вариация (среднеквадратическое отклонение) значений признака внутри каждой группы незначительна и составляет:
в первой группе:
приво второй группе:
прив третьей группе:
приНапротив, вариация значений признака между группами составляет
приИтак, на основе проведенного анализа дисперсий внутри каждой из образованных групп и между группами, показано, что объем инвестиций на 60 % объясняется различием в месторасположении регионов, а на 40 % влиянием прочих факторов.
Покажем вычисленные в п. 2.3 основные статистические характеристики в таблице 2.7.
Таблица 2.7Обобщающая таблица статистических расчетов
Показатель | |||||
Значение | 555,17 | 47468,66 | 72308,31 | 119776,97 | 0,60 |
Краткая характеристика | Признаки месторасположение региона и объем инвестиций взаимосвязаны |
Предположим, что объем отгруженной инновационной продукции в Новосибирской области зависит от величины инвестиций в инновационную деятельность. Проверим это предположение с помощью корреляционно-регрессионного анализа (КРА).
Этапы анализа:
1. Постановка цели исследования.
Определить наличие или отсутствие зависимости между показателями величины инвестиций в инновационную деятельность и объема отгруженной инновационной продукции. Построить регрессионную модель этой зависимости, проверить её качество и использовать эту модель для анализа и прогнозирования.
2. Сбор исходной статистической информации.
Информацию для исследования находим в статистических ежегодниках. Представим данные в табличной форме (табл. 2.8).
Таблица 2.8 Исходная информация для КРА
Годы | Объем инвестиций, млн. руб. | Объем отгруженной инновационной продукции, млн. руб. |
2000 | 205,6 | 784,8 |
2001 | 687,4 | 1384,0 |
2002 | 662,1 | 1016,4 |
2003 | 638,2 | 1548,2 |
2004 | 273,3 | 1555,7 |
2005 | 278,6 | 1630,2 |
2006 | 361,2 | 1676,0 |
2007 | 398,1 | 1900,1 |
2008 | 431,6 | 2032,4 |
2009 | 620,2 | 2864,8 |
Введем обозначения: xi – объем инвестиций, yi– объем отгруженной инновационной продукции. Графически зависимость исходных данных представлена на рисунке 2.6.
Рис.2.1. Зависимость объема отгруженной инновационной продукции от объема инвестиций
3. Оценка тесноты связи между признаками.
3.1. Предположим, что изучаемые признаки связаны линейной зависимостью. Рассчитаем линейный коэффициент корреляции по формуле:
Промежуточные расчеты представлены в таблице 2.9.Таблица 2.9 Промежуточные расчеты для определения параметров регрессии
Годы | xi | yi | xy | x2 | y2 |
2000 | 205,6 | 784,8 | 161354,9 | 42271,36 | 615911,0 |
2001 | 687,4 | 1384,0 | 951361,6 | 472518,76 | 1915456,0 |
2002 | 662,1 | 1016,4 | 672958,4 | 438376,41 | 1033069,0 |
2003 | 638,2 | 1548,2 | 988061,2 | 407299,24 | 2396923,2 |
2004 | 273,3 | 1555,7 | 425172,8 | 74692,89 | 2420202,5 |
2005 | 278,6 | 1630,2 | 454173,7 | 77617,96 | 2657552,0 |
2006 | 361,2 | 1676,0 | 605371,2 | 130465,44 | 2808976,0 |
2007 | 398,1 | 1900,1 | 756424,1 | 158483,61 | 3610325,7 |
2008 | 431,6 | 2032,4 | 877191,5 | 186278,56 | 4130722,3 |
2009 | 620,2 | 2864,8 | 1776718 | 384648,04 | 8206792,6 |
∑ | 4556,3 | 16392,6 | 7668788 | 2372652,27 | 29795930,4 |
Коэффициент линейной корреляции, равный 0,215, свидетельствует о наличии прямой связи между объемом инвестиций и объемом отгруженной инновационной продукции, но недостаточно тесной.
3.2 Оценка существенности коэффициента корреляции
Для этого найдем расчетное значение t-критерия Стьюдента:
По таблице критических точек распределения Стьюдента найдем tкр при уровне значимости α=0,05 и числе степеней свободы
ν = n-k-1 = 10-1-1=8. tкр = 2,306. Так как tрасч <tкр (0,622 < 2,306), то линейный коэффициент не считается значимым, а связь между xи y не является существенной, а обусловлена действием случайных причин.
4. Построение уравнения регрессии.
Этап построения регрессионного уравнения состоит в идентификации (оценке) его параметров, оценке их значимости и значимости уравнения в целом.
4.1. Идентификация регрессии. Построим линейную однофакторную регрессионную модель вида
Для оценки неизвестных параметров a0, a1 используется метод наименьших квадратов, заключающийся в минимизации суммы квадратов отклонений теоретических значений зависимой переменной от наблюдаемых (эмпирических).