1.3.1 Элементы теории корреляции
График восстановленной функциональной зависимости по результатам измерений называется кривой регрессии. Для проверки согласия построенной кривой регрессии с результатами эксперимента обычно вводят следующие числовые характеристики: коэффициент корреляции (линейная зависимость), корреляционное отношение и коэффициент детерминированности. При этом результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке этой таблицы приводятся численности тех пар , компоненты которых попадают в соответствующие интервалы группировки по каждой переменной. Предполагая длины интервалов группировки (по каждой переменной) равными между собой, выбирают центры (соответственно ) этих интервалов и числа в качестве основы для расчетов.
Коэффициент корреляции является мерой линейной связи между зависимыми случайными величинами: он показывает, насколько хорошо в среднем может быть представлена одна из величин в виде линейной функции от другой.
Коэффициент корреляции вычисляется по формуле:
Формула 5
,
где , и ¾ среднее арифметическое значение соответственно по x и y.
Коэффициент корреляции между случайными величинами по абсолютной величине не превосходит 1. Чем ближе к 1, тем теснее линейная связь между x и y.
В случае нелинейной корреляционной связи условные средние значения располагаются около кривой линии. В этом случае в качестве характеристики силы связи рекомендуется использовать корреляционное отношение, интерпретация которого не зависит от вида исследуемой зависимости.
Корреляционное отношение вычисляется по формуле:
Формула 6
,
где , а числитель характеризует рассеяние условных средних около безусловного среднего .
Всегда . Равенство соответствует некоррелированным случайным величинам; тогда и только тогда, когда имеется точная функциональная связь между y и x. В случае линейной зависимости y от x корреляционное отношение совпадает с квадратом коэффициента корреляции. Величина используется в качестве индикатора отклонения регрессии от линейной.
Корреляционное отношение является мерой корреляционной связи y с x в какой угодно форме, но не может дать представления о степени приближенности эмпирических данных к специальной форме. Чтобы выяснить насколько точно построенная кривая отражает эмпирические данные вводится еще одна характеристика ¾ коэффициент детерминированности.
Для его описания рассмотрим следующие величины. - полная сумма квадратов, где среднее значение .
Можно доказать следующее равенство
Формула 7
.
Первое слагаемое равно и называется остаточной суммой квадратов. Оно характеризует отклонение экспериментальных данных от теоретических.
Второе слагаемое равно и называется регрессионной суммой квадратов и оно характеризует разброс данных.
Очевидно, что справедливо следующее равенство
.
Коэффициент детерминированности определяется по формуле:
Формула 8
Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента детерминированности , который показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными. Если он равен 1, то имеет место полная корреляция с моделью, т.е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y.
Коэффициент детерминированности всегда не превосходит корреляционное отношение. В случае когда выполняется равенство то можно считать, что построенная эмпирическая формула наиболее точно отражает эмпирические данные.
1.3.2 Анализ методики расчета параметров уравнения аппроксимации
Имеются данные о поступлении платежей на страховую и накопительную части трудовой пенсии в апреле 2008-2009 гг. Требуется подобрать наилучшее аппроксимирующее уравнение для прогнозирования подневных доходов на 2010 год.
Таблица 1.2 - Данные о ежедневных платежах за март 2008-2009 гг.
2009 год | 2008 год | |||||||
0201 | 0203 | Всего | Уд.вес | 0201 | 0203 | Всего | Уд.вес | |
1 марта | 38 075 608 | 219 839 | 38 295 447 | 4,05% | 26 219 017 | 561 586 | 26 780 603 | 3,41% |
2 марта | 27 924 104 | -27 511 | 27 896 594 | 2,95% | 15 284 693 | 397 055 | 15 681 748 | 2,00% |
3 марта | 26 769 576 | 165 352 | 26 934 928 | 2,85% | 26 392 970 | 196 627 | 26 589 597 | 3,39% |
4 марта | 0,00% | 76 751 642 | 239 321 | 76 990 963 | 9,81% | |||
5 марта | 0,00% | 53 416 141 | 624 115 | 54 040 256 | 6,89% | |||
6 марта | 48 102 720 | -247 006 | 47 855 714 | 5,07% | 0,00% | |||
7 марта | 61 043 353 | 206 410 | 61 249 764 | 6,48% | 0,00% | |||
8 марта | 0,00% | 0,00% | ||||||
9 марта | 63 872 495 | 113 826 | 63 986 321 | 6,77% | 43 490 994 | 576 194 | 44 067 188 | 5,62% |
10 марта | 42 447 905 | 65 424 | 42 513 329 | 4,50% | 34 567 637 | 157 328 | 34 724 965 | 4,42% |
11 марта | 0,00% | 48 594 476 | 270 565 | 48 865 041 | 6,23% | |||
12 марта | 0,00% | 0,00% | ||||||
13 марта | 80 821 104 | 123 478 | 80 944 581 | 8,57% | 0,00% | |||
14 марта | 65 866 282 | 180 481 | 66 046 763 | 6,99% | 53 812 196 | 285 052 | 54 097 248 | 6,89% |
15 марта | 96 947 902 | 197 886 | 97 145 788 | 10,28% | 72 289 085 | -124 541 | 72 164 544 | 9,20% |
16 марта | 209 784 466 | 267 103 | 210 051 570 | 22,23% | 133 282 097 | 517 786 | 133 799 883 | 17,05% |
17 марта | 40 318 074 | 200 662 | 40 518 736 | 4,29% | 60 919 056 | 525 786 | 61 444 842 | 7,83% |
18 марта | 0,00% | 229 023 | 12 591 | 241 614 | 0,03% | |||
19 марта | 0,00% | 0,00% | ||||||
20 марта | 13 322 678 | 224 507 | 13 547 185 | 1,43% | 0,00% | |||
21 марта | 10 587 294 | 154 600 | 10 741 894 | 1,14% | 27 644 185 | 596 942 | 28 241 127 | 3,60% |
22 марта | 10 688 719 | 234 840 | 10 923 559 | 1,16% | 10 010 292 | 734 431 | 10 744 723 | 1,37% |
23 марта | 10 498 134 | 246 286 | 10 744 420 | 1,14% | 12 140 488 | 226 233 | 12 366 721 | 1,58% |
24 марта | 8 891 905 | 197 794 | 9 089 699 | 0,96% | 6 884 511 | 305 531 | 7 190 042 | 0,92% |
25 марта | 0,00% | 6 268 602 | 260 540 | 6 529 142 | 0,83% | |||
26 марта | 0,00% | 0,00% | ||||||
27 марта | 9 045 516 | 159 026 | 9 204 542 | 0,97% | 0,00% | |||
28 марта | 13 423 033 | 220 148 | 13 643 181 | 1,44% | 7 917 532 | 192 898 | 8 110 430 | 1,03% |
29 марта | 21 831 927 | 224 853 | 22 056 780 | 2,33% | 10 905 505 | 216 583 | 11 122 088 | 1,42% |
30 марта | 14 038 321 | 266 626 | 14 304 946 | 1,51% | 249 474 | 10 440 | 259 914 | 0,03% |
31 марта | 26 851 739 | 279 953 | 27 131 692 | 2,87% | 50 701 644 | 56 866 | 50 758 510 | 6,47% |
ИТОГО: | 941 152 855 | 3 674 577 | 944 827 432 | 100,00% | 777 971 260 | 6 839 929 | 784 811 189 | 100,00% |
Для проведения расчетов, данные целесообразно расположить в виде таблицы