Смекни!
smekni.com

Статистическое моделирование 2 (стр. 2 из 3)

Задача 2

По данным газеты «Из рук в руки» была сделана мной выборка данных о стоимости квартир на вторичном рынке за определенный период (от 25 мая 2009г). Выборка содержит 20 данных. В качестве факторов, влияющих на стоимость квартир выбрала число комнат (х1), общая площадь (х2), жилая площадь (х3), площадь кухни (х4). Необходимо построить уравнение регрессии, характеризующее зависимость цены от всех качеств. Оценить экономический смысл и значимость полученного уравнения.

1. Вводим данные в таблицу (EXCEL) – столбцы № x1, х2, х3, х4,y. Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу [Приложение1]

0 x1 x2 x3 x4 y
1 1 32 19 6 1200
2 1 36 18 6 1400
3 1 29 16 5 980
4 1 29 16 5 1100
5 2 43 28,8 9 1420
6 2 52 34 10 1950
7 2 45 30 9 980
8 2 46 29 9 1350
9 3 54 38 11 1800
10 4 58 40 12 2500
11 3 50 35 10 1700
12 3 60 38 11 2100
13 4 70 52 16 1750
14 4 70 52 16 2950
15 4 76 49 15 3500
16 4 68 47 14 2400
17 5 145 86 26 5800
18 5 82 65 19 4500
19 5 83 66 20 4000
20 5 130 78 24 6500
Сумма 61 1258 836,8 253 49880
Ср. значение 3,05 62,9 41,84 12,7 2494

Найдем средние квадратические отклонения признаков:

σy =

= 1556,86;

σx1 =

= 1,43;

σx2 =

= 29,74;

σx3 =

= 19,63;

σx4 =

= 5,90;

2. Вычисление параметров линейного уравнения множественной регрессии.

Для нахождения параметров линейного уравнения множественной регрессии

y = a + b1x1 + b2x2 + b3x3 + b4x4.

Найдем матрицу парных коэффициентов корреляции (Данные

Анализ данных
Корреляция)

Получаем следующий результат:

x1 x2 x3 x4 y
x1 1
x2 0,847337 1
x3 0,940703 0,964635 1
x4 0,931673 0,968788 0,998364 1
y 0,833719 0,949023 0,930686 0,934761 1

1 столбец матрицы содержит коэффициенты корреляции y с каждым из факторов x. Таким образом, наиболее сильное влияние на стоимость квартиры оказывают факторы x2;x3;x4.

С помощью инструмента Регрессия (Данные

Анализ данных
Регрессия) получаем следующие результаты:

Регрессионная статистика

Множественный R

0,951256

R-квадрат

0,904889

Нормированный R-квадрат

0,879526

Стандартная ошибка

554,416

Наблюдения

20

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

4

43865823

10966455,67

35,6775234

1,69079E-07

Остаток

15

4610657

307377,1554

Итого

19

48476480

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-688,384

308,7638

-2,229485916

0,04148909

-1346,49885

-30,2701

x1

67,88611

351,3708

0,193203645

0,84939123

-681,042959

816,8152

x2

39,08366

21,70148

1,800967381

0,09184344

-7,17195183

85,33927

x3

-31,251

130,6937

-0,239116437

0,81425164

-309,817992

247,316

x4

144,2302

404,6624

0,35642105

0,72648905

-718,287253

1006,748

Таким образом, получили уравнение множественной регрессии:

yx = 67,89x1 + 39,08x2 - 31,25x3 +144,23x4 – 688,38

Экономический смысл уравнения: при увеличении числа комнат квартиры х1, цена квартиры увеличивается на 67,89 тыс. руб.; при увеличении общей площади квартиры х2, цена квартиры увеличивается на 39,08 тыс. руб.; при увеличении жилой площади квартиры х3, цена квартиры уменьшается на 31,25 тыс. руб.; при увеличении площади кухни х4, цена квартиры увеличивается на 144,23 тыс.руб.

- Остаточная дисперсия: σ2 = 230532,9.

- Средняя ошибка аппроксимации:

= 19%. Качество модели, исходя из относительных отклонений по каждому наблюдения, признается плохим, т.к. средняя ошибка аппроксимация превышает 15%.

- Множественный коэффициент корреляции R= 0,951.

- Коэффициент детерминации R2 = 0,905. Нескорректированный коэффициент детерминации R2 оценивает долю дисперсии стоимости за счет предоставленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 90,5% и указывает на весьма высокую степень обусловленности вариации стоимости с вариацией факторов, т.е. на весьма тесную связь факторов со стоимостью.

- Cкорректированный коэффициент детерминации

2 = 0,88 определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Все четыре коэффициента указывают на весьма высокую 88% детерминированность стоимости y в модели с факторами x1, х2, х3, х4.

3.Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает

-критерия Фишера:

Число наблюдений n =20, число независимых переменных m=4, отсюда

k1 =4, k2 =20-4-1 =15.

Fфакт. =

= 35,68.

Получили, что Fфакт. > Fтабл. = 3,06 (при n=20), т.е. вероятность случайно получить такое значение F-критерия не превышает допустимый уровень значимости 5%. Таким образом, подтверждается статистическая значимость всего уравнения и показателя тесноты связи.

4. Оценим статистическую значимость параметров чистой регрессии с помощью t- критерия Стьюдента.

Фактические значения t-критерия:

tx4 = b4/se4 = 144,23/404,66 = 0,356;

tx3 = b3/se3 = -31,251/130,694= - 0,239;

tx2 = b2/se2 = 39,08/21,7 =1,80;

tx1= b1/se1 = 67,89/351,4 = 0,193.

Табличное значение критерия при уровне значимости α=0,05 и числе степеней k = 15 составит tтабл = 2,13.

Таким образом, признается статистическая значимость параметра x4, т.к. tx4>tтабл, и случайная природа формирования параметра x1,x2,x3, tx1<tтабл, tx2<tтабл, tx3<tтабл.

Доверительные интервалы для параметров чистой регрессии:

-681,04

x1
816,82; -309,82
x3
247,32;

-7,17

x2
85,34; -718,29
x4
1006,75.

Выводы:

- Уравнение множественной регрессии

yx = 67,89x1 + 39,08x2 - 31,25x3 +144,23x4 – 688,38.

Экономический смысл уравнения: при увеличении числа комнат квартиры х1, цена квартиры увеличивается на 67,89 тыс. руб.; при увеличении общей площади квартиры х2, цена квартиры увеличивается на 39,08 тыс. руб.; при увеличении жилой площади квартиры х3, цена квартиры уменьшается на 31,25 тыс. руб.; при увеличении площади кухни х4, цена квартиры увеличивается на 144,23 тыс.руб.Множественный коэффициент корреляции R=0,95 указывает на связь между переменными x и y прямая, сильная, тесная, т.е. величина потребительских расходов значительно зависит от денежных доходов.