- Регрессионный анализ, позволяющий выразить с помощью уравнения форму взаимосвязи.
- Корреляционный анализ используется для определения тесноты или силы взаимосвязи признаков. Корреляционные методы делят:
- Параметрические методы, которые дают оценку тесноты связи непосредственно на базе значений факторного и результативного признаков;
- Непараметрические методы – дают оценку на основе условных оценок признаков.
Оценка тесноты криволинейных зависимостей дается после расчета параметра уравнения регрессии. Поэтому такой метод называется корреляционно-регрессивным.
Если анализируется зависимость одного факторного и результативного признаков, то в этом случае имеем дело с парной корреляцией и регрессией. Если анализируются несколько факторных и результативных признаков – это множественная корреляция и регрессия.
3. Парная регрессия.
Регрессия – это линия, характеризующая наиболее общую тенденцию во взаимосвязи факторного и результативного признаков.
Предполагается, что аналитическое уравнение выражает подлинную форму зависимости, а все отклонения от этой функции обусловлены действием различных случайных причин. Так как изучаются корреляционные связи, изменению факторного признака соответствует изменение среднего уровня результативного признака. При построении аналитических группировок мы рассматривали эмпирическую линию регрессии. Однако, эта линия не пригодна для экономического моделирования и ее форма зависит от произвола исследователя. Теоретически линия регрессии в меньшей степени зависит от субъективизма исследователя, однако, здесь так же может быть произвол при выборе формы или функции взаимосвязи. Считается, что выбор функции должен опираться на глубокое знание специфики предмета исследования.
На практике чаще всего применяются следующие формы регрессионных моделей:
- Линейная
;- Полулогарифметическая кривая
;- Гипербола
;- Парабола второго порядка
;- Показательная функция
;- Степенная функция
.Помимо содержательного подхода существует формальная оценка адекватности подобранной регрессионной модели. Лучшей из них считается та, которая наименее удалена от исходных данных.
Данное свойство средней, гласящее, что сумма квадратов отклонений всех вариантов ряда от средней арифметической меньше суммы квадратов их отклонений от любого другого числа, положено в основу метода наименьших квадратов, позволяющего рассчитать параметры избранного уравнения регрессии таким образом, чтобы линия регрессии была в среднем наименее удалена от эмпирических данных.
Пример: данная система двух уравнений с двумя неизвестными а0 и а1 позволяет определить точное значение коэффициентов линейной регрессии.
Анализ формы и параметров взаимосвязи между ценой килограмма репчатого лука и объемом его продаж.
Цена 1 кг лука, руб. | Объем продаж, кг | Товарооборот, руб. | ||||||
3 | 175 | 525 | 9 | -107,73 | 205,68 | -30,68 | 941,26 | 30625 |
3,5 | 200 | 700 | 12,25 | -125,69 | 187,73 | 12,28 | 150,68 | 40000 |
4 | 180 | 720 | 16 | -143,64 | 169,77 | 10,23 | 104,65 | 32400 |
4,5 | 150 | 675 | 20,25 | -161,60 | 151,82 | -1,815 | 3,29 | 22500 |
5 | 160 | 800 | 25 | -179,55 | 133,86 | 26,14 | 683,30 | 25600 |
5,5 | 120 | 660 | 30,25 | -197,51 | 115,91 | 4,09 | 16,77 | 14400 |
6 | 85 | 510 | 36 | -215,46 | 97,95 | -12,95 | 167,70 | 7225 |
6,5 | 90 | 585 | 42,25 | -233,42 | 80,00 | 10,00 | 100,10 | 8100 |
7 | 50 | 350 | 49 | -251,37 | 62,04 | -12,04 | 144,96 | 2500 |
7,5 | 40 | 300 | 56,25 | -269,33 | 44,09 | -4,09 | 16,69 | 1600 |
8 | 25 | 200 | 64 | -287,28 | 26,13 | -1,13 | 1,28 | 625 |
60,5 | 1275 | 6025 | 360,25 | -2172,56 | 1274,96 | 0,045 | 2330,68 | 185575 |
Предположим, что связь между ценой и объемом реализации лука линейная. Тогда для расчета параметров а0 и а1 необходимо решить систему уравнений
,подставляя расчетные значения в систему нормальных уравнений и решая ее. Одним из методов получим коэффициенты уравнения линейной регрессии.
- уравнение регрессии или функция, характеризующая теоретическую зависимость объемов продаж лука от цены на него. Знак минус указывает на обратную зависимость.Параметр а0 характеризует условное значение результативного признака при нулевом значении факторного признака (условный объем продаж лука при нулевой цене на него).
Параметры уравнения регрессии оцениваются на вероятностную надежность. Для этого величина каждого из параметров сравнивается с соответствующей средней ошибкой выборки, то есть
, где - расчетное значение критерия Стьюдента, а - остаточное среднеквадратическое отклонение, характеризующее вариацию эмпирических значений результативного признака относительно соответствующих им теоретических значений (вариацию около линии регрессии).Расчетное значение t критерия сравнивается с табличным значением для
степеней свободы и заданной вероятности. Если p=0,95 то табличное значение равно t=2,262, то есть , следовательно, параметр а0 с вероятностью 0,95 надежен. Параметр а1 оценивается по формуле: , где - это показатель вариации факторного признака.