Рассмотрим в качестве примера зависимость между суточной выработкой продукции Y(т) и величиной основных производственных фондов Х (млн руб.) для совокупности 50 однотипных предприятий (табл. 1).
Для каждого значения, т.е. для каждой строки корреляционной таблицы вычислим групповые средние
где
Вычисленные групповые средние
Аналогично для каждого значения
вычислим групповые средние
По виду ломанной можно определить наличие линейной корреляционной зависимости Y по X между двумя рассматриваемыми переменными, которая выражается тем точнее чем больше объем выборки n:
n=
Поэтому уравнение регрессии(1.3) будем искать в виде:
Отвлечемся на время от рассматриваемого примера и найдем формулы расчета неизвестных параметров уравнения линейной регрессии.
С этой целью применим метод наименьших квадратов, согласно которому неизвестные параметры
S=
На основании необходимого условия экстремума функции двух переменных S=S(
Откуда после преобразования получим систему нормальных уравнений для определения параметров линейной регрессии:
Учитывая (1.5) преобразуем выражение и с учетом (1.7), разделив обе части уравнений (1.10) на n, получим систему нормальных уравнений в виде:
где соответствующие средние определяются по формулам:
Подставляя значение
Коэффициент b1 в уравнении регрессии, называемый выборочным коэффициентом регрессии (или просто коэффициентом регрессии) Yпо Х, будем обозначать символом
Коэффициент регрессии Yпо Х показывает, на сколько единиц в среднем изменяется переменная Y при увеличении переменной Х на одну единицу.
Решая систему (1.11), найдем
где
µ - выборочный корреляционный момент:
µ=
Рассуждая аналогично и полагая уравнение регрессии (1.4) линейным, можно привести его к виду:
где
выборочный коэффициент регрессии (или просто коэффициент регрессии) Х по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной Y на одну единицу
Так как числители в формулах (1.16) и (1.20) для
Перейдем к оценке тесноты корреляционной зависимости. Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида (1.15).На первый взгляд подходящим измерителем тесноты связи Yот Х является коэффициент регрессии
Очевидно, что для «исправления»
Представим уравнение (1.15) в эквивалентном виде:
В этой системе величина
r =
показывает, на сколько величин