Смекни!
smekni.com

Анализ данных как составляющая часть принятия решений (стр. 1 из 2)

Контрольная работа № 1

Вариант 1.

Анализ данных как составляющая часть принятия решений

Задание № 1

Определить с помощью метода Романовского принадлежность максимальных значений к выборкам, оценить однородность дисперсий и средних значений с использованием критерия Фишера и критерия Стьюдента.

Продолжительность рейса, дн.

Выборка:

1) 7,8,6,7,12,8,6,7,13,7,8,9,7,8,8

2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9

Уровень значимость для 1-го варианта = 0,01

Для оценки принадлежности резко выделяющихся значений общей выборке рассчитывается величина ν :

ν = (Χ – Χ) / S ,

где Χ – максимальное значение в выборке;

Χсреднее значение;

S – среднеквадратичное отклонение;

Среднее значение и среднее квадратичное отклонение рассчитываем по формулам:

Χ = Σ Χ / n ,

S = Ö1/(n-1)* Σ (Χ – Χ)²,

Где n объем выборки.

Χ1 = 13 Χ2 = 9

Χ1 = 121 / 15 = 8,07 Χ2 = 114/ 15 =7,6

S1 = Ö 1/14*54,93 = Ö 3,92 = 1,98

S2 = Ö 1/14*13,6= Ö0,9714 = 0,986

ν1= (13-8,07) / 1,98 = 2,49

ν2= (9-7,6) / 0,986 = 1,42

να= 3,07

ν1 < να , следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.

ν2 < να , следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.

Для сравнения дисперсий двух выборок по методу Фишера используется

F –распределение F (k1,k2) , где k1 и k2 степени свободы, k1 = n – 1 и

k2 = n – 1.

Критерий Фишера рассчитывается по формуле:

Fэ = S²1 / S²2

Где S1> S2

Fэ = 3,92/0,972 = 4,03

Fэ таб = 2,4

При заначении Fэ, большим критерия Фишера, расхождение дисперсий существеенно, исследование необходимо прекратить и принять меры по корректировке данных.

Данные первой выборки можно откорректировать – заменив наибольшее значение выборки, на любое другое значение в данной выборке, например = 8.

Произведем расчеты для скорректированной выборки.

Х1 = 12

Продолжительность рейса, дн.

Выборка:

1) 7,8,6,7,12,8,6,7,8,7,8,9,7,8,8

2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9

Χ1 = 116 / 15 = 7,73 Χ2 = 114/ 15 =7,6

S1 = Ö 1/14*28,4 = Ö 2,02 = 1,42

S2 = Ö 1/14*13,6= Ö0,9714 = 0,986

ν1= (12 – 7,73) / 1,42 = 3,001

ν2= (9-7,6) / 0,986 = 1,42

να= 3,07

ν1 < να , следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.

ν2 < να , следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.

Для сравнения дисперсий двух выборок по методу Фишера используется

F –распределение F (k1,k2) , где k1 и k2 степени свободы, k1 = n – 1 и

k2 = n – 1.

Критерий Фишера рассчитывается по формуле:

Fэ = S²1 / S²2

Где S1> S2

Fэ =2,02 /0,972 = 2,08

Fэ таб = 2,4

Fэ < Fэ таб , следовательно расхождение дисперсий носит случайный характер, выборки можно объединить в одну совокупность и приступить к оценке средних значений с помощью критерия Стьюдента.

Рассчитываем величину t:

t =(1 – Χ2| /Ö n1*s1² + n2*s2²)Ö n1* n2*(n1+ n2 – 2)/n1+ n2 ,

где s1²,s2² - смещенные оценки дисперсии

s² = 1/n Σi – Χ)²

s1² = 1/15 * 28,4 = 1,893

s2² = 1/15 * 13,6 = 0,906

t = 0.13/6,48 *√ 210 = 0,02*14.49 = 0.3

tтаб = 1,32

tрасч < tтаб , следовательно, выборки данных являются непротиворечивыми и объединяются в одну совокупность.

Задание № 2

Сделать прогноз, используя метод наименьших квадратов и метод экспоненциального сглаживания. Произвести комбинированную оценку прогноза.

Объем перевозок автомобильным транспортом РФ, млн.т. = yt

Таблица 1

yt

100

129

168

153

t

1

2

3

4

Принимаем, что модель тренда является линейной.

y٭ = a + b * t

a = (Σ yi * Σ ti - Σ ti * Σ (yi * ti )) / n * Σ t²i - (Σ ti

b = (n * Σ( ti * yi ) - Σ ti * Σ yi ) / n * Σ t²i - (Σ ti

a = (550 * 30 – 10 * 1474) / 4 * 30 – 100 = 88

b = ( 4* 1474 – 10*550) / 4 * 30 – 100 = 19,8

a =88 b = 19,8

y1 = 88 + 19,8*1 = 107,8

y2 = 88 + 19,8*2 = 127,6

y3 = 88 + 19,8*3 = 147,4

y4 = 88 + 19,8*4 = 167,2

Для определения основной ошибки прогноза используется зависимость :

st = Σ (yt)² / n-1

st = 688,8/3 = 15,15

Для прогнозирования методом экспоненциального сглаживания используется полученная ранее линейная модель тренда, определяется параметр сглаживания

(α) и начальные условия (0 , 0 ):

α = 2/ n+1

α = 0.4

0 = a –((1-α)/ α )*b)

0 = a –((2*(1-α)/ α )*b)

S¹0 = 88 – 23,76=64,24

S²0 =88 – 59,4=28,6

Вычисляем экспоненциальные средние 1 и 2 порядка :

t = α * yt +(1- α)*t-1

t = α *t + (1- α) *t-1,

а значения коэффициентов для «сглаженного» ряда:

a= 2* S¹t -t ;

b= α / (1- α )*[S¹t - S²t ]

Прогноз на t + l год определяется по формуле:

y´t+l = a+ b* l ,

где l переменная «сглаженного» ряда.

Таблица 2

Период времени

Факт.

значение

Расчетные значения

t

t

a

b

yt

Δ y = yt- yt

1

100

2

129

78,5

48,5

108,5

20

128,5

-0,5

3

168

98,7

68,6

128,8

20,07

148,9

-19,12

4

153

126,4

91,7

161,1

23,2

184,3

31,3

l =1

-

137,1

109,9

164,3

18,1

182,4

-

Ошибка прогноза рассчитывается по следующей формуле: