При анализе социально-экономических явлений множественная регрессия и корреляция применяются одновременно.
1. С помощью регрессии определяется форма связи и оцениваются параметры регрессии.
2. Посредством корреляционного анализа определяется сила связи между факторами.
Значит, можно численно охарактеризовать как интенсивность и направление связей, так и степень влияния различных факторов.
Результаты анализа приобретают количественное выражение: 1) в уравнениях, описывающих форму связи и 2) коэффициентах регрессии.
Кроме изменчивости оцениваются и степень интенсивности корреляции между результативным фактором y и влияющим на него производственными факторами xj.
Степень интенсивности корреляции определяется коэффициентом множественной корреляции Ryxj
Пример: R=0,803 – по шкале Чеддока определяется – высокая степень связи. Для проверки надежности установления коэффициентов множественной корреляции необходимо найти значение критерия Фишера, сравнить с табличным значением при доверительном уровне вероятности суждения и соответствующем числе степеней свободы.
R2 – квадрат коэффициента корреляции или коэффициент множественной детерминации;
n – численность выборочной совокупности;
m – число параметров в уравнении связи, включая и параметр a0.
Если Fфакт.>Fтабл., значит, зависимость результативного y от факторов описывается уравнением достоверно и существенно.
Оценка существенности коэффициентов множественной корреляции при определенной вероятности ошибки (0,05) и числе свободы k – по таблицам определяются критические значения t‑Стьюдента.
tфакт.>tкрит. – связь надежна
Измерить надежное влияние, которое оказывают вариации всех исследуемых факторов, позволяет квадрат множественного коэффициента корреляции – называется коэффициентом множественной детерминации D=R2. Если R=0,803, то D=R2=0,645. И это означает, что 64,5% общей вариации объясняется изменением изучаемых факторов xj. R=0,925
Возможность определить долю, вносимую каждым фактором в модификацию уровня результативного показателя, дает коэффициент частной детерминации:
Степень влияния каждого фактора, включенного в вычисление корреляции, выражается той частью дисперсии значений признака явлений, которая определяется вариацией значений соответствующего фактора.
Сумма dj=D. В нашем примере:
d1=0,201; d4=0,005
d2=0,204; d5=0,166
d3=0,039; d6=0,239
Вывод: Наибольшее влияние оказывают: x6, x2 и x1.
Анализ коэффициентов регрессии
Прямое сравнение коэффициентов регрессии невозможно, так как они не выражены в одинаковых единицах.
а) Применение коэффициентов эластичности
Вывод: Сравнением легко установить, что самое значительное влияние на результативный признак оказывают производственные факторы x2, x6 и x1.
б)
aj– коэффициент регрессии при факторе xj;
Интерпретация
Вывод: x6, x2, x1.
Коэффициент вариации (vxj), больше y x6=18.5% vx2=8,8%, vx1=14,3%.
в) оценка значимости (существенности) коэффициентов регрессии проверяется по значению t – критерия Стьюдента
Значения x1=3,083; x3=0,363; x5=3,059;
t‑критерия: x2=3,781; x4=0,722; x6=6,051.
Вывод: наиболее значимы: x6, x2, x1.
Испытания параметров уравнения регрессии на их типичность
Применительно к совокупностям, у которых n<30 для определений типичности используется t‑критерий Стьюдента.
Алгоритм:
Вычисляются фактические значения t‑критерия:
а) для параметра a0
б) для параметра a1
Полученные по формулам ta0 и ta необходимо сравнить с критическими tk, который находят по таблице Стьюдента с учетом принятого уровня значимости
3. Если t‑факт. больше t‑крит., следовательно полученные в анализе корреляции связи параметров уравнения регрессии признаются типичными.
Параметры получают соответствующие количественные значения, которые записываются в уравнение выбранной f.
Смысловое содержание моделей:
Характеристика средней величины результативного признака
Оценка надежности коэффициента корреляции и коэффициента регрессии.
Коэффициент корреляции может рассчитываться по выборочным данным, значит, может быть искаженным под действием случайных величин. Поэтому должна быть рассчитана ошибка коэффициента корреляции
I. Если число наблюдений достаточно велико (n>50), то
II. Если n<50, или значение r невелико, то приходится решать вопрос о том, насколько реальна связь между y и x. Ответ – при сопоставлении r и
Если
б) а связь – реальной
Если
10. Индексы
Статистический индекс – это относительная величина сравнения сложных совокупностей и отдельных их единиц. При этом под сложной совокупностью понимается такая статистическая совокупность, отдельные элементы которой непосредственно не подлежат суммированию.