Смекни!
smekni.com

Разработка системы учета и прогнозирования ежедневных поступлений страховых взносов на обязательное пенсионное страхование (стр. 4 из 11)

1.3.1 Элементы теории корреляции

График восстановленной функциональной зависимости

по результатам измерений
называется кривой регрессии. Для проверки согласия построенной кривой регрессии с результатами эксперимента обычно вводят следующие числовые характеристики: коэффициент корреляции (линейная зависимость), корреляционное отношение и коэффициент детерминированности. При этом результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке этой таблицы приводятся численности
тех пар
, компоненты которых попадают в соответствующие интервалы группировки по каждой переменной. Предполагая длины интервалов группировки (по каждой переменной) равными между собой, выбирают центры
(соответственно
) этих интервалов и числа
в качестве основы для расчетов.

Коэффициент корреляции является мерой линейной связи между зависимыми случайными величинами: он показывает, насколько хорошо в среднем может быть представлена одна из величин в виде линейной функции от другой.

Коэффициент корреляции вычисляется по формуле:

Формула 5

,

где

,
и
¾ среднее арифметическое значение соответственно по x и y.

Коэффициент корреляции между случайными величинами по абсолютной величине не превосходит 1. Чем ближе

к 1, тем теснее линейная связь между x и y.

В случае нелинейной корреляционной связи условные средние значения располагаются около кривой линии. В этом случае в качестве характеристики силы связи рекомендуется использовать корреляционное отношение, интерпретация которого не зависит от вида исследуемой зависимости.

Корреляционное отношение вычисляется по формуле:

Формула 6

,

где

, а числитель характеризует рассеяние условных средних
около безусловного среднего
.

Всегда

. Равенство
соответствует некоррелированным случайным величинам;
тогда и только тогда, когда имеется точная функциональная связь между y и x. В случае линейной зависимости y от x корреляционное отношение совпадает с квадратом коэффициента корреляции. Величина
используется в качестве индикатора отклонения регрессии от линейной.

Корреляционное отношение является мерой корреляционной связи y с x в какой угодно форме, но не может дать представления о степени приближенности эмпирических данных к специальной форме. Чтобы выяснить насколько точно построенная кривая отражает эмпирические данные вводится еще одна характеристика ¾ коэффициент детерминированности.

Для его описания рассмотрим следующие величины.

- полная сумма квадратов, где
среднее значение
.

Можно доказать следующее равенство

Формула 7


.

Первое слагаемое равно

и называется остаточной суммой квадратов. Оно характеризует отклонение экспериментальных данных от теоретических.

Второе слагаемое равно

и называется регрессионной суммой квадратов и оно характеризует разброс данных.

Очевидно, что справедливо следующее равенство

.

Коэффициент детерминированности определяется по формуле:

Формула 8

Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента детерминированности

, который показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными. Если он равен 1, то имеет место полная корреляция с моделью, т.е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y.

Коэффициент детерминированности всегда не превосходит корреляционное отношение. В случае когда выполняется равенство

то можно считать, что построенная эмпирическая формула наиболее точно отражает эмпирические данные.

1.3.2 Анализ методики расчета параметров уравнения аппроксимации

Имеются данные о поступлении платежей на страховую и накопительную части трудовой пенсии в апреле 2008-2009 гг. Требуется подобрать наилучшее аппроксимирующее уравнение для прогнозирования подневных доходов на 2010 год.

Таблица 1.2 - Данные о ежедневных платежах за март 2008-2009 гг.

2009 год 2008 год
0201 0203 Всего Уд.вес 0201 0203 Всего Уд.вес
1 марта 38 075 608 219 839 38 295 447 4,05% 26 219 017 561 586 26 780 603 3,41%
2 марта 27 924 104 -27 511 27 896 594 2,95% 15 284 693 397 055 15 681 748 2,00%
3 марта 26 769 576 165 352 26 934 928 2,85% 26 392 970 196 627 26 589 597 3,39%
4 марта 0,00% 76 751 642 239 321 76 990 963 9,81%
5 марта 0,00% 53 416 141 624 115 54 040 256 6,89%
6 марта 48 102 720 -247 006 47 855 714 5,07% 0,00%
7 марта 61 043 353 206 410 61 249 764 6,48% 0,00%
8 марта 0,00% 0,00%
9 марта 63 872 495 113 826 63 986 321 6,77% 43 490 994 576 194 44 067 188 5,62%
10 марта 42 447 905 65 424 42 513 329 4,50% 34 567 637 157 328 34 724 965 4,42%
11 марта 0,00% 48 594 476 270 565 48 865 041 6,23%
12 марта 0,00% 0,00%
13 марта 80 821 104 123 478 80 944 581 8,57% 0,00%
14 марта 65 866 282 180 481 66 046 763 6,99% 53 812 196 285 052 54 097 248 6,89%
15 марта 96 947 902 197 886 97 145 788 10,28% 72 289 085 -124 541 72 164 544 9,20%
16 марта 209 784 466 267 103 210 051 570 22,23% 133 282 097 517 786 133 799 883 17,05%
17 марта 40 318 074 200 662 40 518 736 4,29% 60 919 056 525 786 61 444 842 7,83%
18 марта 0,00% 229 023 12 591 241 614 0,03%
19 марта 0,00% 0,00%
20 марта 13 322 678 224 507 13 547 185 1,43% 0,00%
21 марта 10 587 294 154 600 10 741 894 1,14% 27 644 185 596 942 28 241 127 3,60%
22 марта 10 688 719 234 840 10 923 559 1,16% 10 010 292 734 431 10 744 723 1,37%
23 марта 10 498 134 246 286 10 744 420 1,14% 12 140 488 226 233 12 366 721 1,58%
24 марта 8 891 905 197 794 9 089 699 0,96% 6 884 511 305 531 7 190 042 0,92%
25 марта 0,00% 6 268 602 260 540 6 529 142 0,83%
26 марта 0,00% 0,00%
27 марта 9 045 516 159 026 9 204 542 0,97% 0,00%
28 марта 13 423 033 220 148 13 643 181 1,44% 7 917 532 192 898 8 110 430 1,03%
29 марта 21 831 927 224 853 22 056 780 2,33% 10 905 505 216 583 11 122 088 1,42%
30 марта 14 038 321 266 626 14 304 946 1,51% 249 474 10 440 259 914 0,03%
31 марта 26 851 739 279 953 27 131 692 2,87% 50 701 644 56 866 50 758 510 6,47%
ИТОГО: 941 152 855 3 674 577 944 827 432 100,00% 777 971 260 6 839 929 784 811 189 100,00%

Для проведения расчетов, данные целесообразно расположить в виде таблицы