Выбор конкретного уравнения регрессии и его решение осуществляется в рамках табличного процессора MS Excel или статистического программного пакета STADIA[17].
Сущность решения уравнений регрессии заключается в нахождении параметров регрессии (а и b). Это осуществляется по способу наименьших квадратов с использованием системы нормальных уравнений, суть которого заключается в минимизации суммы квадратов отклонений фактических значений результативного показателя от его расчетных значений[18].
При прямолинейной зависимости система нормальных уравнений имеет вид:
∑y = na +b∑x
∑xy = a∑x +b∑x2.При криволинейной зависимости:
∑y=nf+b∑1/x
∑y(1/x)= a∑1/x +b∑(1/x)2.
Для оценки адекватности модели используют такие критерии, как ошибка аппроксимации, F-отношения, коэффициента детерминации, подробно рассмотренные в п. 7.3.
В необходимых случаях построение уравнения регрессии может быть использовано для прогнозирования результативного признака.
Апробируем методику корреляционно-регрессионного анализа на конкретном примере.
Пример 7.1 На основании данных табл. А необходимо проанализировать зависимость между расходами на оплату труда (Y) и выручкой от продажи товаров (х).
Таблица А – Данные о выручке от продажи товаров и сумме расходов на оплату труда в разрезе торговых организаций тыс. руб.
№ мага-зинов | Выручка от продажи товаров | Сумма расходов на оплату труда | № магазинов | Выручка от продажи товаров | Сумма расходов на оплату труда |
А | 1 | 2 | Б | 3 | 4 |
1. | 3 200 | 190 | 15. | 1 690 | 177 |
2. | 500 | 45 | 16. | 7 450 | 230 |
3. | 12 000 | 670 | 17. | 12 900 | 587 |
4. | 8 560 | 345 | 18. | 2 010 | 166 |
5. | 14 100 | 713 | 19. | 1 650 | 105 |
6. | 11 300 | 470 | 20. | 5 115 | 241 |
7. | 4 300 | 194 | 21. | 8 945 | 400 |
8. | 1 010 | 98 | 22. | 11 900 | 523 |
9. | 8 230 | 244 | 23. | 14 200 | 780 |
10. | 12 560 | 510 | 24. | 10 300 | 576 |
11. | 6 201 | 215 | 25. | 11 450 | 425 |
12. | 11 500 | 603 | 26. | 13 000 | 606 |
13. | 13 300 | 575 | 27. | 6 100 | 210 |
14. | 1 000 | 95 | 28. | 7 500 | 249 |
На основании данных табл. А построим график зависимости изменения расходов на оплату труда от изменения товарооборота (см. рисунок).
Зависимость динамики расходов на оплату труда от выручки от продажи товаров
Данные графика свидетельствуют о том, что между расходами на оплату труда и выручкой от продажи товаров существует прямолинейная зависимость. Далее измерим тесноту связи между изучаемыми показателями на основе коэффициента корреляции, для чего сгруппируем магазины по сумме выручки от продажи товаров (см. тему 3) и составим следующую разработочную таблицу (табл. Б).
Таблица Б – Разработочная таблица для определения показателей, используемых при расчете коэффициента корреляции
Группы магазинов по сумме выручки от продажи товаров | Количество магазинов | Выручка от продажи товаров (xi), млн руб. | Сумма расходов на оплату труда (yi), млн руб. | yi xi | xi2 | yi2 |
От 500 до 3 220 включ. | 7,000 | 11,060 | 0,876 | 9,689 | 122,324 | 0,768 |
От 3 221 до 5 440 включ. | 2,000 | 9,415 | 0,435 | 4,096 | 88,642 | 0,190 |
От 5 441 до 8 160 включ. | 4,000 | 27,251 | 0,904 | 24,635 | 742,617 | 0,818 |
От 8 161 до 10 880 включ. | 4,000 | 36,035 | 1,565 | 56,394 | 1298,521 | 2,450 |
Св. 10 881 | 11,000 | 138,210 | 5,859 | 809,772 | 19102,004 | 34,328 |
Итого | 28,000 | 221,971 | 9,639 | 904,586 | 21354,107 | 38,550 |
Примечание. Согласно данным таблицы, элементы расчета коэффициента корреляции имеют следующие значения:
Σxi = 221,971;
Σyi = 9,639; Σyixi =904,586; Σx2i = 21 354,107; Σy2 = 38,550.
Рассчитанные данные подставляются в формулу коэффициента корреляции:
r =
Коэффициент детерминации: r2=0,82=0,64.
Коэффициент корреляции, равный 0,8 ед., означает наличие высокой стохастической зависимости между суммой расходов на оплату труда и выручкой от реализации. Образование данной стохастической зависимости объясняется наличием (и доминированием в данном случае) постоянной части расходов по заработной плате, начисление которой не увязано с динамикой результата хозяйственной деятельности организации, т. е. выручки от продажи, а значение коэффициента детерминации, составляющее 0,64 ед. означает, что изменение расходов на оплату труда на 64 % объясняется изменением выручки от продажи, что дает основание для проведения регрессионного анализа.
Согласно виду графика, представленного на рисунке, между изучаемыми показателями существует прямолинейная корреляционная зависимость, в связи с чем уравнение регрессии будет иметь вид: Y(х) = а +b·x,
где Y – расходы на оплату труда; х – выручка от продажи товаров.
Для определения параметров а и в следует решить систему нормальных уравнений методом наименьших квадратов:
∑y = na +b∑x∑xy = a∑x +b∑x2.
Отсюда значения коэффициента в определяется по формуле
.
Рассчитанное значение параметра в говорит о том, что при увеличении выручки от продажи товаров на 1 млн руб. расходы на оплату труда возрастут на 42,3 тыс. руб. При этом подставив значение данного параметра в первое уравнение системы, определим значение параметра а:
∑y = na +b∑x
9,639=а·28+0,0423·221,971
28а=0,0423·221,971-9,639
28а=0,2496
а=0,009.
Значение параметра а показывает, что коэффициент регрессии может быть применим для торговых организаций с размером выручки от продажи за год свыше 9 млн. руб.
В целом уравнение регрессии имеет вид: y = 0,009+0,0423·х.
Полученное уравнение связи можно использовать для прогнозирования суммы расходов на оплату труда, если выручка от продажи возрастет и составит, например, 15 млн руб.:
y = 0,009+0,0423·х=0,009+0,0423·15=0,644 млн. руб.
7.3 Критерии оценки адекватности результатов стохастического анализа
При выполнении регрессионного анализа необходимо получить оценки, позволяющие оценить точность модели, вероятность ее существования и обоснованность применения в аналитических целях. Таким образом, качество корреляционно-регрессионного анализа обеспечивается выполнением ряда следующих условий:
1. Однородность исходной информации, которая оценивается в зависимости от относительного ее распределения около среднего значения. Критериями здесь служат (подробно см. тему 3):