ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННАЯ ТЕХНОЛОГИЧЕСКАЯ АКАДЕМИЯ
Контрольная работа
по курсу
Эконометрика
(вариант 8)
Задача 1
В исходной таблице (вариант 8) представлены статистические данные о размерах жилой площади и стоимости квартир:
Жилая площадь, х | Цена кв., у |
20 | 15,9 |
40,5 | 27 |
16 | 13,5 |
20 | 15,1 |
28 | 21,1 |
46,3 | 28,7 |
45,9 | 27,2 |
47,5 | 28,3 |
87,2 | 52,3 |
17,7 | 22 |
31,1 | 28 |
48,7 | 45 |
65,8 | 51 |
21,4 | 34,4 |
Требуется:
1. Построить поле корреляции и сформулировать гипотезу о виде уравнения регрессии (линейное, показательное, гиперболическое и т.п.).
2. Построить наиболее подходящее уравнение регрессии.
3. Оценить величину влияния фактора на исследуемый показатель с помощью коэффициента корреляции и детерминации.
4. Оценить качество построенной модели с точки зрения адекватности и точности. Для этого оценить математическое ожидание значений остаточного ряда, проверить случайность уровней остатков ряда, их независимость и соответствие нормальному закону. Для оценки точности использовать среднюю относительную ошибку аппроксимации.
5. С помощью коэффициента эластичности определить силу влияния фактора на результативный показатель.
6. Проверить значимость коэффициента регрессии и провести его интервальную оценку.
7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличилось на 10 % от среднего уровня. Определить доверительный интервал прогноза для уровня значимости
.8. Сделать выводы по полученным результатам.
Решение:
Для удобства вычислений в ходе решения будем достраивать исходную таблицу данных до вспомогательной (см. Приложение 1), округляя и занося в расчетную таблицу промежуточные результаты.
1. Построим поле корреляции:
Визуальный анализ полученного графика показывает, что точки поля корреляции располагаются вдоль некоторой воображаемой прямой линии, но не очень плотно, рассеиваясь около неё. Поэтому делаем предположение о линейном виде уравнения регрессии. Нельзя сказать, что прослеживается тесная зависимость, но заметно, что с увеличением размера жилой площади х наблюдается тенденция к увеличению стоимости квартир у. Можно предположить, что связь размера жилой площади и ее стоимости положительная, не очень тесная, и на цену квартир оказывают влияние и другие факторы (район места ее расположения, этаж, наличие коммуникаций, состояние квартиры и т.п.).
2. Построим в соответствии с выбранным линейным видом уравнение регрессии:
Чтобы определить параметры линейной модели с помощью метода наименьших квадратов, решим систему уравнений на основе исходных и расчетных данных:
Рассчитав на основе исходных данных необходимые значения (графы 3, 5 таблицы Приложения 1), получаем систему:
Решив полученную систему уравнений при помощи надстройки «Поиск решения» приложения MSExcel, находим:
b0 = 9,308595
b1 = 0,52076
Составим уравнение парной линейной регрессии:
В декартовой системе координат ХОУ на поле корреляции строим график линии регрессии по найденному уравнению (рис.1).
3. Для оценки влияния фактора на исследуемый показатель вычислим линейный коэффициент корреляции и коэффициент детерминации.
Используя надстройку приложения MSExcel «Пакет анализа» - инструмент «Корреляция», находим величину линейного коэффициента корреляции.
Столбец 1 | Столбец 2 | |
Столбец 1 | 1 | |
Столбец 2 | 0,8559571 | 1 |
По величине коэффициента корреляции
, принадлежащей интервалу (0,7; 1), оценим качественную характеристику связи как сильную прямую.Находим парный коэффициент детерминации:
Изменение У примерно на 74 % определяется вариацией фактора х, на 26 % - влиянием других факторов. То есть изменения величины стоимости жилой площади на 74% обусловлены колебаниями ее размеров, и на 26 % - колебаниями и изменениями других факторов и условий.
4. Оценим качество построенной модели
Производим расчеты данных для граф 6-10 вспомогательной таблицы (Приложение 1).
Оценим качество построенной модели с точки зрения адекватности. Для этого проверим выполнение следующих требований:
1) Уровни ряда остатков имеют случайный характер. Для проверки выполнения данного требования воспользуемся критерием поворотных точек (пиков).
-3,829 | -3,4095 | -4,145 | -4,629 | -2,797 | -4,7313 | -6,0229 | -5,7565 | -2,4402 | 3,4693 | 2,4879 | 10,3183 | 7,4092 | 13,9416 |
+ | - | + | + | - | - | + | - | + | + | + | + |
Число поворотных точек р = 8
Поскольку р > 5, требование считаем выполненным.
2) Математическое ожидание уровня ряда остатков равно нулю.
Поскольку полученное значение близко к 0, требование считаем выполненным.
3) Дисперсия каждого отклонения одинакова для всех х. Для проверки выполнения данного требования используем критерий Гольдфельда-Квандта. Исходные значения х расположим в возрастающем порядке:
Жилая площадь, х | Цена кв., у. |
16 | 13,5 |
17,7 | 22 |
20 | 15,9 |
20 | 15,1 |
21,4 | 34,4 |
28 | 21,1 |
31,1 | 28 |
40,5 | 27 |
45,9 | 27,2 |
46,3 | 28,7 |
47,5 | 28,3 |
48,7 | 45 |
65,8 | 51 |
87,2 | 52,3 |
Делим полученную таблицу на 2 равные части
Жилая площадь, х | Цена кв., у | Жилая площадь, х | Цена кв., у |
16 | 13,5 | 40,5 | 27 |
17,7 | 22 | 45,9 | 27,2 |
20 | 15,9 | 46,3 | 28,7 |
20 | 15, | 47,5 | 28,3 |
21,4 | 34,4 | 48,7 | 45 |
28 | 21,1 | 65,8 | 51 |
31,1 | 28 | 87,2 | 52,3 |
По каждой группе строим уравнение регрессии:
Жилая площадь, х | Цена кв., у | ||
16 | 13,5 | 256 | 216 |
17,7 | 22 | 313,29 | 389,4 |
20 | 15,9 | 400 | 318 |
20 | 15,1 | 400 | 302 |
21,4 | 34,4 | 457,96 | 736,16 |
28 | 21,1 | 784 | 590,8 |
31,1 | 28 | 967,21 | 870,8 |
154,2 | 150 | 3578,46 | 3423,16 |
Чтобы определить параметры линейной модели с помощью метода наименьших квадратов, решим систему уравнений:
Решив полученную систему уравнений при помощи надстройки «Поиск решения» приложения MSExcel, находим:
b0= 7,01310810173176
b1= 0,65439846490193
Составим уравнение парной линейной регрессии:
На его основе найдем расчетные значения результативного показателя, а также ряд остатков и остаточные суммы квадратов для первой группы:
Жилая площадь, х | Цена кв, у | ( )2 | ||||
16 | 13,5 | 256 | 216 | 17,477 | -3,977 | 15,816529 |
17,7 | 22 | 313,29 | 389,4 | 18,5888 | 3,4112 | 11,636285 |
20 | 15,9 | 400 | 318 | 20,093 | -4,193 | 17,581249 |
20 | 15,1 | 400 | 302 | 20,093 | -4,993 | 24,930049 |
21,4 | 34,4 | 457,96 | 736,16 | 21,0086 | 13,3914 | 179,3296 |
28 | 21,1 | 784 | 590,8 | 25,325 | -4,225 | 17,850625 |
31,1 | 28 | 967,21 | 870,8 | 27,3524 | 0,6476 | 0,4193858 |
154,2 | 150 | 3578,46 | 3423,16 | 176,0978 | 0,0622 | 267,5637 |
Рассчитаем аналогичные параметры для второй группы данных:
Жилая площадь, х | Цена кв, у | ( )2 | ||||
40,5 | 27 | 1640,25 | 1093,5 | 28,6765 | -1,6765 | 2,81065225 |
45,9 | 27,2 | 2106,81 | 1248,48 | 31,9003 | -4,7003 | 22,0928201 |
46,3 | 28,7 | 2143,69 | 1328,81 | 32,1391 | -3,4391 | 11,8274088 |
47,5 | 28,3 | 2256,25 | 1344,25 | 32,8555 | -4,5555 | 20,7525803 |
48,7 | 45 | 2371,69 | 2191,5 | 33,5719 | 11,4281 | 130,60147 |
65,8 | 51 | 4329,64 | 3355,8 | 43,7806 | 7,2194 | 52,1197364 |
87,2 | 52,3 | 7603,84 | 4560,56 | 56,5564 | -4,2564 | 18,116941 |
381,9 | 259,5 | 22452,17 | 15122,9 | 259,480 | 0,0197 | 258,3216 |
Решив полученную систему уравнений