Каждый коэффициент уравнения регрессии вычисляется по формуле:
где
- элементы обратной матрицы ( Х ТХ) -1.Таким образом, найдя оценки параметров уравнения регрессионной модели, мы сможем выявить и охарактеризовать существующую связь между зависимой переменной и независимыми переменными. Но также не стоит забывать о наличии в эконометрической регрессионной модели постоянной константе, которая показывает и характеризует наличие вектора остатков неучтенных в модели признаков, которые в свое совокупности также оказывают влияние на критериальную переменную.
Также следует учесть еще и то, что для практического использования моделей регрессии большое значение имеет их адекватность, то есть соответствие фактическим статистическим данным.
Обычно регрессионный анализ проводится, и это уместно отметить и в структуре данной исследовательской работы, для ограниченной по объёму совокупности, поэтому различные показатели, характеризующие полученную взаимосвязь, могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
Проверка значимости уравнения регрессии проводится по F-критерию. Для этого вычисляется остаточная дисперсия :
и
Данная расчетная статистика сравнивается с табличным значением
при уровне значимости α и числе ступеней свободы k 1 = п - 1, k 2 = п – k - 1.Гипотеза про значимость уравнения регрессии принимается при условии:
При численности объектов анализа до 30 единиц возникает также необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.
Значимость коэффициентов регрессии проверяется по t-критерию.
Статистика
сравнивается с табличным значением
при уровне значимости α и числе степеней свободы k 1 = п – k - 1.2.2.Построение эконометрических моделей и выводы по ним.
Исходя из теоретических данных, несомненно, в данной исследовательской работе будет использоваться многофакторный анализ и множественная корреляция.
Чтобы выявить какие признаки оказывают наибольшее влияние на объемы нефтедобычи в нашей стране, в качестве результирующего показателя в данном исследовании был взят объем добычи нефти в Российской Федерации. Оценивать влияние на объем добычи я буду с помощью определяющих признаков, а именно с помощью: числа действующих организаций в отрасли (Х 1), среднегодовой численности промышленно-производственного персонала (Х 2), объема эксплуатационного бурения на нефть (Х 3), среднесуточного дебита одной скважины (Х 4), степени износа основных фондов отрасли (Х 5), количества введенных в действие производственных мощностей (нефтяных скважин, Х 6), коэффициента обновления основных фондов (Х 7), уровня рентабельности предприятий отрасли (Х 8).
Все данные были взяты за 10 лет с 2000 по 2009 года. В итоге можно увидеть следующую таблицу:
Таблица 1. Исходные данные
Год | Добыча нефти, млн.т | Число организа-ций | Численностьперсонала,тыс. человек | Объембурения,млн. м | Дебет одной скважины, т | Степень износа основных фондов, % | Ввод в действие нефтяных скважин, ед. | Коэффициент обновления основных фондов | Уровень рентабельности, % |
У | Х 1 | Х 2 | Х 3 | Х 4 | Х 5 | Х 6 | Х 7 | Х 8 | |
2000 | 306,83 | 214 | 213 | 10,20 | 7,50 | 46,90 | 4 198 | 3,40 | 21,20 |
2001 | 301,23 | 273 | 246 | 6,90 | 7,40 | 48,3 | 2 921 | 3,00 | 14,90 |
2002 | 305,64 | 275 | 264 | 7,40 | 7,30 | 49,8 | 2 390 | 1,60 | 14,70 |
2003 | 303,28 | 385 | 289 | 5,00 | 7,70 | 52,1 | 2 274 | 1,70 | 17,60 |
2004 | 305,17 | 431 | 261 | 5,30 | 7,70 | 51,2 | 2 081 | 1,70 | 57,90 |
2005 | 323,52 | 439 | 267 | 9,30 | 7,50 | 53,3 | 2 833 | 2,90 | 66,70 |
2006 | 348,13 | 421 | 347 | 8,80 | 7,70 | 51,0 | 3 813 | 4,20 | 46,50 |
2007 | 379,56 | 436 | 331 | 8,60 | 8,30 | 53,9 | 3 145 | 3,70 | 20,60 |
2008 | 421,34 | 465 | 321 | 9,10 | 9,40 | 53,7 | 3 004 | 4,10 | 20,70 |
2009 | 459,21 | 637 | 293 | 8,30 | 10,10 | 53,10 | 3 123 | 3,70 | 36,30 |
Все необходимые расчеты оценок эконометрических моделей, а также оценки их значимости, производились с использованием демонстрационной версии программы для обработки статистических данных - IBM SPSS Statistics 19. Она позволяет в своем пакете статистических программ вычислить все необходимые показатели.
Производить анализ я буду поэтапно, чтобы полностью рассмотреть процесс построения эконометрических моделей.
Первый этап - корреляционный анализ. Его цель - определить характер связи (прямая, обратная) и силу связи (связь отсутствует, связь слабая, умеренная, заметная, сильная, весьма сильная, полная связь). Корреляционный анализ создает информацию о характере и степени выраженности связи (коэффициент корреляции), которая используется для отбора существенных факторов, а также для планирования эффективной последовательности расчета параметров регрессионных уравнений. При одном факторе вычисляют коэффициент корреляции, а при наличии нескольких факторов строят корреляционную матрицу, из которой выясняют два вида связей: (1) связи зависимой переменной с независимыми, (2) связи между самими независимыми.
Рассмотрение матрицы позволяет, во первых, выявить факторы, действительно влияющие на исследуемую зависимую переменную, и выстроить (ранжировать) их по убыванию связи; во-вторых, минимизировать число факторов в модели, исключив часть факторов, которые сильно или функционально связаны с другими факторами (речь идет о связях независимых переменных между собой).
Таблица 2. Матрица коэффициентов парной корреляции
У | Х 1 | Х 2 | Х 3 | Х 4 | Х 5 | Х 6 | Х 7 | Х 8 | |
У | 1 | ||||||||
Х 1 | 0,805* | 1 | |||||||
Х 2 | 0,567 | 0,593 | 1 | ||||||
Х 3 | 0,382 | - 0,002 | 0,068 | 1 | |||||
Х 4 | 0,964* | 0,805* | 0,434 | 0,220 | 1 | ||||
Х 5 | 0,630 | 0,819* | 0,720* | - 0,013 | 0,584 | 1 | |||
Х 6 | 0,221 | - 0,153 | 0,039 | 0,813* | 0,094 | - 0,324 | 1 | ||
Х 7 | 0,663* | 0,332 | 0,481 | 0,757* | 0,521 | 0,212 | 0,779* | 1 | |
Х 8 | - 0,006 | 0,429 | 0,071 | 0,058 | - 0,046 | 0,310 | -0,085 | 0,009 | 1 |
В получившейся таблице значения отмеченные знаком «*» являются значимыми на уровне 0,01, это показывает, что с ошибкой всего в 1 % можно говорить о том, что связи существует.
Исходя из результатов полученной таблицы можно говорить о том, что наибольшее влияние на объем добычи нефти оказывают такие признаки, как: среднесуточный дебит одной скважины (Х 4, парный коэффициент корреляции – 0,964), число действующих организаций в отрасли (Х 1, парный коэффициент корреляции – 0,805), а также коэффициента обновления основных фондов (Х 7). Не смотря на то, что парный коэффициент корреляции не очень высок, всего 0,663, все же является значимым.
На данном этапе также возможно произвести исключение факторов, которые сильно связаны с другими. При наличии сильной коллинеарности факторов рекомендуется исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Таким образом, из уравнения множественной регрессии необходимо исключить факторы: среднегодовой численности промышленно-производственного персонала (Х 2), степени износа основных фондов отрасли (Х 5), количества введенных в действие производственных мощностей (нефтяных скважин, Х 6), коэффициента обновления основных фондов (Х 7). Данные факторы являются малоинформативными и недостаточно статистически надежными. После исключения указанных факторов матрица коэффициентов парной корреляции будет выглядеть следующим образом (табл. 3).
Таблица 3. Матрица коэффициентов парной корреляции
после устранения мультиколлениарности.
У | Х 1 | Х 3 | Х 4 | Х 8 | |
У | 1 | ||||
Х 1 | 0,805 | 1 | |||
Х 3 | 0,382 | -0,002 | 1 | ||
Х 4 | 0,964 | 0,805 | 0,22 | 1 | |
Х 8 | -0,006 | 0,429 | 0,058 | -0,046 | 1 |
После проведения исключения малоинформативных факторов, возможен переход к дальнейшей оценки зависимости нефтедобычи от различных параметров.