год | Численность кандидатов наук, чел. | t | t2 | yt | Yt |
2003 | 988 | -3 | 9 | -2964 | 909 |
2004 | 856 | -2 | 4 | -1712 | 876 |
2005 | 787 | -1 | 1 | -787 | 844 |
2006 | 760 | 0 | 0 | 0 | 811 |
2007 | 773 | 1 | 1 | 773 | 779 |
2008 | 764 | 2 | 4 | 1528 | 746 |
2009 | 751 | 3 | 9 | 2253 | 714 |
Сумма | 5679 | 0 | 28 | -909 | 5679 |
Находим: 1)
2)
3)
Из табл.17 следует, что численность кандидатов наук, как показывает метод укрупнения интервалов и скользящей средней в среднем по трехлетиям снижается с 877 до 763 человека. А метод аналитического выравнивания по прямой свидетельствует о том, что в среднем за анализируемый периодчисленность кандидатов наук снижается на 32 человека.
Далее определяем тренд, т.е. прогноз на будущее по численности кандидатов наук (рис. 5)
Рис. 5. Динамика численности кандидатов наук
На основе расчетов можно сделать вывод о том, что если тенденция сохранится на уровне среднего абсолютного прироста, то в 2010 году численность кандидатов наук Калужской области составит 712 человек. Если же тенденция сохранится на уровне темпа роста, то в 2010 году численность кандидатов наук Калужской области будет приравниваться к 717 чел. А в соответствии с уравнением прямой в 2010 году численность кандидатов наук Калужской области составит 681 человек.
3.2. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Последним этапом исследования является корреляционно-регрессионный анализ данных, заключающийся в установлении наличия или отсутствия взаимосвязи между данными совокупности. Первый шаг – корреляционный анализ. Его задачи сводятся к измерению тесноты связи между варьирующими признаками и оценке факторов, оказывающих наибольшее влияние на результативный признак.
В качестве результативного признака выберем численность персонала, занятого научными исследованиями и разработками.
По числовым значениям результативного и факторных признаков (ПРИЛОЖЕНИЕ 4 таблица 8) получаем матрицу линейных коэффициентов корреляции, показывающих связи между результативным и каждым из факторных признаков, а также между факторными признаками соответственно (табл. 19)
Таблица 19 - Матрица парных коэффициентов
Численность персонала, занятого научными исследованиями и разработками, чел. | Численность докторов наук, чел. | Численность кандидатов наук, чел. | |
Численность персонала, занятого научными исследованиями и разработками, чел. | 1 | ||
Численность докторов наук, чел. | 0,160 | 1 | |
Численность кандидатов наук, чел. | 0,926 | 0,248 | 1 |
Полученная матрица показывает, что все показатели неодинаково взаимосвязаны. Так, например, взаимосвязь между численностью персонала, занятого научными разработками и исследованиями и численностью кандидатов наук прямая умеренная, т.к. значение, равное 0,926, находится в пределах от 0,5 до 1. Коэффициенты корреляции, равные 0,160 и 0,248 свидетельствуют о наличии слабых связей между численностью персонала, занятого научными разработками и исследованиями и численностью докторов наук. и между численностью докторов наук и численностью кандидатов наук.
Показателем тесноты связи, устанавливаемой между численностью персонала, занятого научными разработками и исследованиями и двумя выбранными факторными признаками, является совокупный коэффициент множественной корреляции R. Зависимость изменения численности персонала, занятого научными разработками и исследованиями под влиянием отобранных факторов характеризуется совокупным коэффициентом множественной детерминации R2. Результаты регрессионной статистики оформим в таблице 20.
Таблица 20 - Регрессионная статистика
Множественный R | 0,929 |
R-квадрат | 0,863 |
Нормированный R-квадрат | 0,795 |
Стандартная ошибка | 530,501 |
Наблюдения | 7 |
Из таблицы 20 видно, что множественный R - множественный коэффициент корреляции, равный 0,929 характеризует наличие умеренной взаимосвязи между признаками, включенными в модель. Второй показатель R2 - это множественный коэффициент детерминации показывает вариацию результативного признака на 86,3%, обусловленную влиянием учтенных в модели факторов. При этом влияние неучтенных факторов составляет 13,7%.
Используя специальную компьютерную программу, рассчитываем параметры уравнения регрессии с двумя факторами. Результаты оформим в таблицу 21.
Таблица 21 - Расчет параметров уравнения регрессии
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | -3807,769 | 11871,412 | -0,321 | 0,764 | -36768,092 | 29152,554 | -36768,092 | 29152,554 |
Переменная X 1 | 21,252 | 54,839 | 0,388 | 0,718 | -131,005 | 173,509 | -131,005 | 173,509 |
Переменная X 2 | 12,959 | 2,617 | 4,952 | 0,008 | 5,693 | 20,225 | 5,693 | 20,225 |
По этим данным составляем уравнение регрессии (14)
Yx1x2= -3807,769 +21,252 x1+12,959x2
Из уравнения регрессии параметр x1 = 21,252 показывает, что при увеличении численности докторов наук на 1 численность персонала, занятого научными разработками и исследованиями увеличится на 21, x2 = 12,959 показывает, что при увеличении численности кандидатов наук на 1 численность персонала, занятого научными разработками и исследованиями возрастает на 13. Первый признак оказывает большее влияние на результативный.
Для использования модели регрессии большое значение имеет ее адекватность, т.е. соответствие фактического значения с табличным. Общая оценка адекватности может быть получена с помощью дисперсионного F-критерия Фишера. Для этого полученное значение критерия Fрасч сравнивают с табличным Fтабл. Результаты расчетов сводим в таблицу 22:
Таблица 22- Дисперсионный анализ
df | SS | MS | F | Значимость F | |
Регрессия | 2 | 7112295,127 | 3556147,564 | 12,636 | 0,019 |
Остаток | 4 | 1125725,730 | 281431,433 | ||
Итого | 6 | 8238020,857 |
Модель является адекватной, т.к. Fрасч> значимости F (Fтабл): 12,636>0,019.
Вывод остатков представлен в таблице (ПРИЛОЖЕНИЕ 6 таблица 23) и графически остатки отражены на рисунке (ПРИЛОЖЕНИЕ 7 рис.6).
ЗАКЛЮЧЕНИЕ
В работе был проведен статистический анализ кадрового потенциала науки РФ (Калужской области).
Первым этапом работы был анализ однородности совокупности, по результатам которого можно сделать вывод, что совокупность является условно однородной, т.к. в задаче рассматривается финансовый коэффициент. Также можно отметить, что средний объём затрат на технологические инновации по рассматриваемой совокупности областей составляет 6073,3 млн. руб.
Значение моды равное 3645,6 млн. руб. свидетельствует о том, что большинство областей имеет объём затрат на технологические инновации 3645,6 млн. руб. Значение медианы равное 4257,2 млн. руб. показывает, что половина областей имеет объём затрат на технологические инновации не выше 4257,2 млн. руб., а другая половина не ниже 4257,2 млн. руб.
Вторым этапом работы было построение аналитической и типологической группировок. В качестве группировочного признака взят объём затрат на технологические инновации.
Анализ аналитической группировки показывает, что при увеличении объёма затрат на технологические инновации с 2065,0 млн. руб. в 1 группе до 41032,8 млн. руб. в 6 группе численность персонала, занятого научными исследованиями и разработками, численность докторов наук и численность кандидатов наук колеблются. Максимальная численность персонала, занятого научными исследованиями и разработками 36914 человек характерна для 2 группы. Наибольшая численность докторов и кандидатов наук также характерна для 2 группы 710 и 2547 соответственно. А наибольшее число организаций, выполнявших научные исследования и разработки 254 – для 6 группы.
Анализ типологической группировки показывает, что объём затрат на технологические инновации в высшей типологической группе больше на 32939,1 млн. руб., чем в низшей группе. Численность персонала, занятого научными исследованиями и разработками в высшей группе больше на 5849 человек, чем в низшей. При этом численность докторов и кандидатов наук возрастает от низшей типологической группы к высшей, т.е. с 28 до 77 человек и с 101 до 234 человек. Число организаций, выполнявших научные исследования и разработки в высшей группе больше на 176, чем в низшей.
На основе расчетов динамики можно сделать следующие выводы.
Если тенденция сохранится на уровне среднего абсолютного прироста, то в 2010 году численность персонала, занятого научными исследованиями и разработками Калужской области составит 9829 человек. Если же тенденция сохранится на уровне темпа роста, то в 2010 году численность персонала, занятого научными исследованиями и разработками Калужской области будет приравниваться к 9907 чел. А в соответствии с уравнением прямой в 2010 году численность персонала, занятого научными исследованиями и разработками Калужской области составит 9591 человек.