Бензин марки А-76 стоил в среднем 15,76 руб., АИ-92 - 18,59 руб., АИ-95 - 20,09 руб.
Обработка статистических данных уже давно применяется в самых разнообразных видах человеческой деятельности. На данный момент трудно назвать ту сферу, в которой она бы не использовалась. Но, пожалуй, ни в одной области знаний и практической деятельности обработка статистических данных не играет такой исключительно большой роли, как в экономике, имеющей дело с обработкой и анализом огромных массивов информации о социально-экономических явлениях и процессах. Всесторонний и глубокий анализ этой информации, так называемых статистических данных, предполагает использование различных специальных методов, важное место среди которых занимают корреляционный и регрессионный анализы обработки статистических данных.
Исследование цен на бензин очень актуально в настоящее время, поскольку именно от этих цен зависят цены других товаров и услуг.
В данной работе будет рассмотрена зависимость цен на бензин от времени и таких факторов, как
- цены на нефть, руб. за тонну (X1),
- официальный курс доллара на конец периода, рублей за доллар США (Х2),
- объем производства нефти, млн.тонн (Х3),
- индекс потребительских цен (X4) (базисные индексы к декабрю предыдущего года).
Данные показатели выбраны неслучайно. Цена бензина, являющегося продуктом нефтепереработки, непосредственно связана с ценой указанного природного ресурса и объемами его выработки. Курс же доллара оказывает существенное влияние на всю российскую экономику, в частности на формирование цен на её внутренних рынках. Непосредственная связь этого параметра с ценами на бензин может также быть найдена в том, что объем нефти, экспортируемой из страны, а следовательно не идущий на производство топлива, напрямую зависит от курса доллара США, ведь чем выше этот показатель, тем выгоднее для поставщиков продавать сырье заграницу. ИПЦ отражает общее изменение цен внутри страны, а поскольку экономически доказанным является то, что изменение цен на одни товары в абсолютном большинстве случаев (в условиях свободной конкуренции) ведет к росту цен других товаров, резонно предположить, что изменение цен товаров по стране влияет на исследуемый в работе показатель.
В связи с поставленной для данной работы целью было сформулировано несколько взаимосвязанных задач:
1. Обоснование возможности использования методов динамических рядов и корреляционно-регрессионного анализа для построения моделей, описывающих изменение цен на бензин.
2. Использование данных методов для построения моделей, описывающих изменение цен на бензин.
3. Прогнозирование цен на бензин на будущие периоды с помощью полученных моделей и выбор наиболее адекватной из них.
Предварительная обработка данных необходима для определения возможности использования методов динамических рядов и корреляционно-регрессионного анализа для построения моделей, описывающих изменение цен на бензин.
Расчет выборочных характеристик:
Средняя | 15,60077 |
Медиана | 15,51 |
Мода | 16,79 |
Минимум | 11,34 |
Максимум | 18,94 |
Размах вариации | 7,6 |
Дисперсия | 5,393387 |
Среднеквадратическое отклонение | 2,322367 |
Коэффициент вариации | 14,9% |
По соотношению средней, моды, медианы можно сказать, что распределение приблизительно близко к нормальному закону, а по значению коэффициента вариации видно, что совокупность достаточно однородна, следовательно, средняя достаточно типична.
2) Аномальных наблюдений не обнаружено на уровне значимости 5%
3)Проверка гипотезы о нормальном законе распределения.
На основе исходных данных, представленных в таблице Приложения 1, можно построить гистограмму и график на нормальной вероятностной бумаге для исследуемого показателя Yt.
По гистограмме и графику на нормальной вероятностной бумаге видно, что распределение величины Yt относительно близко к нормальному закону. (см. Приложение 2).
По диаграмме рассеивания видно, что можно построить такую прямую, которая бы описывала имеющуюся тенденцию цен к повышению, т.е. распределение Yt не случайно. Следовательно, результирующий показатель Yt имеет прямую функциональную зависимость от времени, а значит, необходимо проверить его на автокорреляцию уровней временного ряда. Для этого вычисляются коэффициенты автокорреляции. Величина максимального лага определяется по формуле , где Т- объем выборки. Следовательно, .Коррелограмма имеет вид:
Все коэффициенты автокорреляции положительны и постепенно снижаются Следовательно, можно сделать вывод о том, что в ряду наблюдается долгосрочная тенденция, для такого ряда лучше всего подходит трендовая модель вида
Для исследуемого временного ряда Y можно подобрать несколько трендовых моделей: линейную, полином, нелинейную. Используя пошаговые процедуры отбора переменных, выбрана наиболее адекватная из них. В данном случае это линейная модель (нелинейная модель и полином, приведены в Приложении 3).
Линейная модель имеет вид:
Regression Summary for Dependent Variable: Y R= ,96060625 RI= ,9226437 Adjusted RI= ,92067692 F(1,37)=442,05 p<0,0000 Std.Error of estimate: ,66263 | ||||||
BETA | St. Err. of BETA | B | St. Err.of B | t(37) | p-level | |
Intercpt | 11,80362 | 0,209464 | 56,35156 | 0,000000 | ||
T | 0,960606 | 0,045689 | 0,19257 | 0,009159 | 21,02507 | 0,000000 |
У=11,8+ 0,193*Т
Исследуя данную модель на адекватность при помощи коэффициента детерминации, критерия Фишера, критерия Стьюдента и проведения анализа остатков (см. Приложение 4), можно прийти к выводу, что поскольку общий и скорректированный коэффициенты детерминации достаточно близки к 1, то можно сделать вывод о достаточно сильном влиянии факторных признаков на результирующий показатель Y. Уравнение значимо по критерию Фишера. Рассмотрев критерий Стьюдента для коэффициентов регрессии β0 и β1 можно сделать вывод, что оба коэффициента также значимы. Выполняются 2 условия Гаусса-Маркова из 3. Таким образом, видно, что линейная модель достаточно адекватна, но, тем не менее, нельзя сказать, что она описывает поведение цен на бензин полностью. Поэтому обоснованным будет построение регрессии, выявляющую зависимость не только от времени, но и от других факторов.
При прогнозировании цен на бензин АИ-92 на следующие 4 периода, т.е. на апрель, май, июнь, июль 2007 года при помощи трендовой модели получены следующий данные:
Точечные прогнозы составляют 19,50655 руб. за литр в апреле, 19, 69912 руб. за литр в мае, 19, 8917 руб. за литр в июне и 20,08427 руб. за литр в июле. Соответствующие интервальные прогнозные значения представлены следующими интервалами [19,07;19,94], [19,25;20,15], [19,43;20,36] и [19,60; 20,57].
Прежде чем проводить корреляционный анализ необходимо устранить долгосрочную тенденцию (тренд) в уровнях временных рядов. Для этого используется процедура взятия последовательных разностей, а дальнейший корреляционный анализ ведется с помощью остатков. Ряды проверяются на долгосрочную тенденцию с помощью коррелограммы. Изначальные и измененные коррелограммы представлены в Приложении 5. Были устранены долгосрочные тенденции во всех показателях. Только после этого был проведен корреляционный анализ.
По графикам функций (см. Приложение 6) можно сказать, что признаки Х1 (цены на нефть) и Х4 (ИПЦ) оказывают достаточно сильное прямое влияния на Y (цена на аи-92) в текущем периоде, а признак Х3 (объем производства нефти) оказывает значительное обратное влияние на Y с запаздыванием в 8 месяцев. Х2 (курс доллара США) оказывает незначительное влияние на зависимую переменную в периоде T-2, то есть с запаздыванием в 2 месяца. Таким образом, будет строиться зависимость Y от Х1, Х2t-2, Х4 и Х3t-7.
ЛИНЕЙНАЯ МОДЕЛЬ
Regression Summary for Dependent Variable: Y R= ,93580485 RI= ,87573073 Adjusted RI= ,86476579 F(3,34)=79,866 p<,00000 Std.Error of estimate: ,83708 | ||||||
BETA | St. Err.of BETA | B | St. Err.of B | t(36) | p-level | |
Intercpt | 44,88042 | 5,364096 | 8,36682 | 0,000000 | ||
X1 | 0,569918 | 0,071597 | 0,00106 | 0,000133 | 7,96005 | 0,000000 |
X4 | 0,235686 | 0,070247 | 0,05802 | 0,017294 | 3,35508 | 0,001962 |
Х2t-2 | -0,561348 | 0,080791 | -1,42428 | 0,204987 | -6,94812 | 0,000000 |
Y = 43,76 + 0,001*X1 – 1,42*X2t-2 + 0,06*X4
Исследовав данную модель на адекватность при помощи коэффициента детерминации, критерия Фишера, критерия Стьюдента и проведения анализа остатков (см. Приложение 7), можно прийти к выводу, что поскольку общий и скорректированный коэффициенты детерминации достаточно близки к 1, то можно сделать вывод о достаточно сильном влиянии факторных признаков на результирующий показатель Y. Уравнение значимо по критерию Фишера. Рассмотрев критерий Стьюдента для коэффициентов регрессии β0 и β1 можно сделать вывод, что оба коэффициента также значимы. Выполняются 2 условия Гаусса-Маркова из 3. Таким образом, Таким образом, можно сказать, что линейная модель достаточно адекватна, хотя выполняются не все условия Гаусса-Маркова, однако прогнозирование по данной модели также представляется возможным.