В нашей задаче число наблюдений небольшое, значит, оценивать существенность (значимость) линейного коэффициента корреляции будем по формулам (87) и (88):
= 0,3073/2,8284 = 0,1086; = 0,9516/0,1086 = 8,7591. При вероятности 95% tтабл=2,306, а при вероятности 99% tтабл=3,355, значит, tРАСЧ> tТАБЛ, что дает возможность считать линейный коэффициент корреляции r = 0,9516 значимым.5. Подбор уравнения регрессии представляет собой математическое описание изменения взаимно коррелируемых величин по эмпирическим (фактическим) данным. Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь величины результативного признака у со значениями факторного признака х.
Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими. Они обычно обозначаются
(читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. = f(x). (Иногда для простоты записи вместо пишут .)Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа. Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.
Для аналитической связи между х и у могут использоваться следующие простые виды уравнений:
– прямая линия; – парабола; – гипербола; – показательная функция; – логарифмическая функция и др.Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные — криволинейными зависимостями.
Выбрав тип функции, по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака
были бы максимально близки к эмпирическим данным.Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака
должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е. .Поставив данное условие, легко определить, при каких значениях
, и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной. Данный метод уже использовался нами в методических указаниях к теме 4 «Ряды динамики», поэтому, воспользуемся формулой (57) для нахождения параметров теоретической линии регрессии в нашей задаче, заменив параметр t на x. (89)Исходные данные и все расчеты необходимых сумм представим в таблице 12.
Таблица 12. Вспомогательные расчеты для решения задачи
i | x | y | x*x | y*x | y' | ||
1 | 12 | 28 | 144 | 336 | 15 | 5184 | 7225 |
2 | 16 | 40 | 256 | 640 | 23,5 | 3600 | 5852,25 |
3 | 25 | 38 | 625 | 950 | 42,625 | 3844 | 3291,891 |
4 | 38 | 65 | 1444 | 2470 | 70,25 | 1225 | 885,0625 |
5 | 43 | 80 | 1849 | 3440 | 80,875 | 400 | 365,7656 |
6 | 55 | 101 | 3025 | 5555 | 106,375 | 1 | 40,64063 |
7 | 60 | 95 | 3600 | 5700 | 117 | 25 | 289 |
8 | 80 | 125 | 6400 | 10000 | 159,5 | 625 | 3540,25 |
9 | 91 | 183 | 8281 | 16653 | 182,875 | 6889 | 6868,266 |
10 | 100 | 245 | 10000 | 24500 | 202 | 21025 | 10404 |
Итого | 520 | 1000 | 35624 | 70244 | 1000 | 42818 | 38762,125 |
Отсюда искомая линия регрессии: =–10,5+2,125x. Для иллюстрации построим график эмпирической (маркеры-кружочки) и теоретической (маркеры-квадратики) линий регрессии.
Рис.6. График эмпирической и теоретической линий регрессии.
6. Теоретическое корреляционное отношение представляет собой универсальный показатель тесноты связи. Измерить тесноту связи между коррелируемыми величинами – это значит определить, насколько вариация результативного признака обусловлена вариацией факторного признака. Ранее были рассмотрены показатели, с помощью которых можно выявить наличие корреляционной связи между двумя признаками x и y и измерить тесноту этой связи: коэффициент Фехнера и линейный коэффициент корреляции.
Наряду с ними существует универсальный показатель – корреляционное отношение (или коэффициент корреляции по Пирсону), применимое ко всем случаям корреляционной зависимости независимо от формы этой связи. Следует различать эмпирическое и теоретическое корреляционные отношения. Эмпирическое корреляционное отношение рассчитывается на основе правила сложения дисперсий как корень квадратный из отношения межгрупповой дисперсии к общей дисперсии, т.е.
. (90)