Смекни!
smekni.com

Статистические методы выявления взаимосвязей общественных явлений (стр. 2 из 5)

степенная

(6.5)

параболическая

(6.6)

гиперболическая

(6.7)

Наиболее часто используемая форма связи между коррелируемыми признаками – линейная, при парной корреляции выражается уравнением (6.2), где а0 – среднее значение в точке x=0, поэтому экономической интерпретации коэффициента нет; а1 – коэффициент регрессии, показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Система нормальных уравнений МНК для линейной парной регрессии имеет следующий вид:

(6.8)

Отсюда можно выразить коэффициенты регрессии:

;

. (6.9)

Для практического использования регрессионных моделей необходима проверка их адекватности. При численности объектов анализа до 30 единиц возникает необходимость проверить, насколько вычисленные параметры характерны для отображаемого комплекса условий, не являются ли полученные значения параметров результатом действия случайных причин. Значимость коэффициентов регрессии применительно к совокупности n<30 определяется с помощью t-критерия Стьюдента. При этом вычисляются фактические значения t-критерия:

для параметра а0:

, (6.10)

для параметра а1:

. (6.11)

В формулах (6.10) и (6.11):

- среднее квадратическое отклонение результативного признака
от выровненных значений
. (6.12)

- среднее квадратическое отклонение факторного признака
от общей средней
. (6.13)

Полученные по формулам (6.10) и (6.11) фактические значения

и
сравниваются с критическим
, который получают по таблице Стьюдента с учетом принятого уровня значимости
и числа степеней свободы ν(ν=n-k-1, где n – число наблюдений, k – число факторов, включенных в уравнение регрессии). Рассчитанные параметры а0 и а1 уравнения регрессии признаются типичными, если tфактическое больше tкритического.

4.2. Корреляционный анализ позволяет установить тесноту связи между факторами и решить следующие задачи:

· ответить на вопрос: существует ли связь?

· выявить изменение связи в различных ситуациях реальных данных;

· определить наиболее значимые факторы в результативном признаке;

Различают:

· парную корреляцию – это зависимость между результативным и факторным признаком;

· частную корреляцию – это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;

· множественную – многофакторное влияние в статической модели

.

К простейшим показателям тесной связи относятся:

· линейный коэффициент корреляции К.Пирсона;

· коэффициент детерминации;

· коэффициенты корреляции знаков – для оценки тесноты связи качественных признаков (непараметрические методы), Г. Фехнера, К. Спирмэна, М. Кэндэла.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:

(6.16)

. (6.17)

а также

или
.

Корреляционный анализ выполняет оценку адекватности регрессионной модели, но путем установления тесноты связи.

Оценка линейного коэффициента корреляции

Значение r Характер связи Интерпретация связи
r = 0 Отсутствует Изменение x не влияет на изменения y
0 < r < 1 Прямая С увеличением x увеличивается y
-1 > r > 0 Обратная С увеличением x уменьшается y и наоборот
r = 1 Функциональная Каждомузначениюфакторногопризнакастрогосоответствует одно значение результативного

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого определяется фактическое значение критерия

:

, (6.18)

Вычисленное по формуле (6.18) значение

сравнивается с критическим
, который получают по таблице Стьюдента с учетом принятого уровня значимости
и числа степеней свободы ν.

Коэффициент корреляции считается статистически значимым, если tрасч превышает

( tрасч >
).

Универсальным показателем тесноты связи является теоретическое корреляционное отношение:

, (6.19)

где

общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х;

факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у;

остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х.

По правилу сложения дисперсий:

, т.е.
. (6.19)

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)

Значение
Характер связи Значение
Характер связи
η = 0 Отсутствует 0,5 ≤ η < 0,7 Заметная
0 < η < 0,2 Очень слабая 0,7 ≤ η < 0,9 Сильная
0,2 ≤ η < 0,3 Слабая 0,9 ≤ η < 1 Весьма сильная
0,3 ≤ η < 0,5 Умеренная η = 1 Функциональная

Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. η = |r|.

Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:

, (6.20)

где

парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен:

.
Условие включения факторных признаков в регрессионную модель – наличие тесной связи между результативным и факторными признаками и как можно менее существенная связь между факторными признаками.

Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:

, (6.21)

где R2 – коэффициент множественной детерминации (R2

);

k – число факторных признаков, включенных в уравнение регрессии.

Связь считается существенной, если Fрасч > Fтабл – табличного значения F-критерия для заданного уровня значимости α и числе степеней свободы ν1 = k2 = n – k – 1.