Смекни!
smekni.com

«Анализ модели множественной линейной регрессии» (стр. 2 из 7)

2.2 Обнаружение гетероскедастичности

Очень часто появление проблемы гетероскедастичности можно предвидеть заранее, основываясь на знании характера данных. В таких случаях можно предпринять соответствующие действия по устранению этого эффекта на этапе спецификации модели регрессии, и это позволит уменьшить или, возможно, устранить необходимость формальной проверки. К настоящему времени для такой проверки предложено большое число тестов (и, соответственно, критериев для них). Мы рассмотрим три обычно используемых теста (критерия), в которых делаются различные предположения о зависимости между дисперсией случайного члена и величиной объясняющих переменных: тест ранговой корреляции Спирмена, тест Голдфелда—Квандта и тест Глейзера.

Тест ранговой корреляции Спирмена

При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия случайного члена будет либо увеличиваться, либо уменьшаться по мере увеличения

, и поэтому в регрессии, оцениваемой с помощью МНК; абсолютные величины остатков и значения объясняющих переменных будут коррелированы. Данные по
и остатки упорядочиваются, и коэффициент ранговой корреляции определяется как

, (2.2.1)

где

— разность между рангом
и рангом е.
Если предположить, что коэффициент корреляции для генеральной совокупности равен нулю, то коэффициент ранговой корреляции имеет нормальное распределение с математическим ожиданием 0 и дисперсией
в больших выборках. Следовательно, соответствующая тестовая статистика равна
, и при использовании двустороннего критерия нулевая гипотеза об отсутствии гетероскедастичности будет отклонена при уровне значимости в 5%, если она превысит 1,96, и при уровне значимости в 1%, если она превысит 2,58.

Применим тест ранговой корреляции Спирмена к нашей модели. Для простоты изложения подробные расчеты приведены лишь для

.

упорядоченная х1

ранг

упорядоченная |e|

ранг

D

-1,849459746

7

0,008280966

8

-1

1

-1,388153599

3

0,024533337

2

1

1

-1,270872375

1

0,066601421

18

-17

289

-1,239597381

2

0,109125921

7

-5

25

-1,106678661

5

0,109137124

20

-15

225

-1,091041164

12

0,115128486

15

-3

9

-1,059766171

6

0,129180745

12

-6

36

-0,856478716

4

0,179692968

24

-20

400

-0,137153876

17

0,184931495

17

0

0

-0,082422638

22

0,200673797

10

12

144

-0,07460389

11

0,274351484

22

-11

121

0,050496083

9

0,321946398

23

-14

196

0,292877279

20

0,328435011

1

19

361

0,535258475

14

0,365273023

11

3

9

0,535258475

19

0,39452205

6

13

169

0,566533468

15

0,458740222

14

1

1

0,60562721

8

0,54427352

16

-8

64

0,746364678

16

0,616338961

19

-3

9

0,769820923

21

0,64321145

5

16

256

0,840189658

24

0,649611436

13

11

121

1,082570854

18

0,725844891

9

9

81

1,184214581

13

0,74336366

4

9

81

1,27803956

10

1,186499516

21

-11

121

1,668976974

23

1,47627288

3

20

400

коэффициент ранговой корреляции Спирмена

-0,356521739

3120

тестовая статистика

-1,709818195

(тестовая статистика для
=1,447090034)

(тестовая статистика для
=0,796525062)

(тестовая статистика для
=0,492094017)

Т.к. статистики по модулю меньше 1,96, то при уровне значимости 0,05 нет оснований отвергнуть нулевую гипотезу об отсутствии гетероскедастичности.

Тест Голдфелда-Квандта

Вероятно, наиболее популярным формальным критерием является критерий, предложенный С. Голдфелдом и Р. Квандтом . При проведении проверки по этому критерию предполагается, что стандартное отклонение (

) распределения вероятностей
пропорционально значению
в этом наблюдении. Предполагается также, что случайный член распределен нормально и не подвержен автокорреляции.

Все

наблюдений в выборке упорядочиваются по величине
, после чего оцениваются отдельные регрессии для первых
и для последних
наблюдений; средние
наблюдений отбрасываются. Если предположение относительно природы гетероскедастичности верно, то дисперсия и в последних
наблюдениях будет больше, чем в первых
и это будет отражено в сумме квадратов остатков в двух указанных «частных регрессиях. Обозначая суммы квадратов остатков в регрессиях для первых
и последних
наблюдений соответственно через RSS1 и RSS2, рассчитаем отношение RSS2/RSS1, которое имеет Г-распределение с (
— k— 1) и (
—k— 1) степенями свободы, где k — число объясняющих переменных в регрессионном уравнении. Мощность критерия зависит от выбора
отношению к n. Основываясь на результатах некоторых проведенных ими экспериментов, С. Голдфелд и Р. Квандт утверждают, что должно составлять порядка 11, когда n= 30, и порядка 22, когда n = 60.