Для составления корреляционной таблицы парной связи материал предварительно группируется по обоим признакам. Затем строится таблица, в которой по строкам откладываются группы одного (например, результативного) признака, а по столбцам размещаются группы другого (теперь факторного) признака. В клетках этой таблицы отмечается число единиц, имеющих определенную величину того и другого признаков. Итоги по строкам (
Корреляционная зависимость задается таблицей:
Таблица 3
х у | | | … | | |
| | | … | | |
| | | … | | |
… | … | … | … | … | … |
| | | … | | |
| | | … | | |
Корреляционная таблица дает общее представление о направлении связи. Когда оба признака расположены в возрастающем порядке, числа предприятий в клетках сосредотачиваются в направлении диагонали слева направо, что указывает на прямую связь между признаками. Все числа предприятий сосредотачиваются в эллипсе, вытянутом по этой диагонали, называемом корреляционным эллипсом. Чем более сжат этот эллипс, тем кучнее частоты располагаются около его диагонали, тем теснее связь между признаками.
Эмпирическое корреляционное отношение.
Теснота или сила связи между двумя признаками может быть измерена показателем, называемым эмпирическим корреляционным отношением. Этот показатель назван эмпирическим, поскольку он может быть рассчитан на основе обычной группировки по факторному и результативному признаку, то есть на основе корреляционной таблицы. Эмпирическое корреляционное отношение получается из правила сложения дисперсий, согласно которому
Отсюда следует правило, что чем больше межгрупповая дисперсия, тем сильнее факторный признак влияет на вариации результативного признака. Составляющие отношения дисперсий вычисляются по данным корреляционной таблицы по следующим формулам:
где
То же соотношение сохраняется и для условных значений
Само отношение дисперсий (подкоренное выражение) называется коэффициентом детерминации (оно равно также квадрату эмпирического корреляционного отношения). Эмпирическое корреляционное отношение изменяется в широких пределах (от 0 до 1). Если оно равно нулю, значит факторный признак на корреляционный не влияет. Если
Коэффициент линейной корреляции и индекс корреляции.
Мерой тесноты связи между двумя статистически связанными признаками служит коэффициент линейной корреляции или просто коэффициент корреляции. Он имеет тот же смысл, что и эмпирическое корреляционное отношение, но может принимать как положительное, так и отрицательное значение. Коэффициент корреляции имеет строгое математическое выражение для линейной связи. Положительное значение будет указывать на прямую связь между признаками, отрицательное – на обратную.
Парный коэффициент корреляции в случае линейной формы связи вычисляют по формуле
а его выборочное значение – по формуле:
При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять по следующей формуле:
Величина коэффициента корреляции изменяется в интервале
При
Если коэффициент корреляции находится в интервале