Контрольная работа № 1
Вариант 1.
Анализ данных как составляющая часть принятия решений
Задание № 1
Определить с помощью метода Романовского принадлежность максимальных значений к выборкам, оценить однородность дисперсий и средних значений с использованием критерия Фишера и критерия Стьюдента.
Продолжительность рейса, дн.
Выборка:
1) 7,8,6,7,12,8,6,7,13,7,8,9,7,8,8
2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9
Уровень значимость для 1-го варианта = 0,01
Для оценки принадлежности резко выделяющихся значений общей выборке рассчитывается величина ν :
ν = (Χ – Χ) / S ,
где Χ – максимальное значение в выборке;
Χ– среднее значение;
S – среднеквадратичное отклонение;
Среднее значение и среднее квадратичное отклонение рассчитываем по формулам:
Χ = Σ Χ / n ,
S = Ö1/(n-1)* Σ (Χ – Χ)²,
Где n – объем выборки.
Χ1 = 13 Χ2 = 9Χ1 = 121 / 15 = 8,07 Χ2 = 114/ 15 =7,6
S1 = Ö 1/14*54,93 = Ö 3,92 = 1,98
S2 = Ö 1/14*13,6= Ö0,9714 = 0,986
ν1= (13-8,07) / 1,98 = 2,49
ν2= (9-7,6) / 0,986 = 1,42
να= 3,07
ν1 < να , следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.
ν2 < να , следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.
Для сравнения дисперсий двух выборок по методу Фишера используется
F –распределение F (k1,k2) , где k1 и k2 степени свободы, k1 = n – 1 и
k2 = n – 1.
Критерий Фишера рассчитывается по формуле:
Fэ = S²1 / S²2
Где S1> S2
Fэ = 3,92/0,972 = 4,03
Fэ таб = 2,4
При заначении Fэ, большим критерия Фишера, расхождение дисперсий существеенно, исследование необходимо прекратить и принять меры по корректировке данных.
Данные первой выборки можно откорректировать – заменив наибольшее значение выборки, на любое другое значение в данной выборке, например = 8.
Произведем расчеты для скорректированной выборки.
Х1 = 12
Продолжительность рейса, дн.
Выборка:
1) 7,8,6,7,12,8,6,7,8,7,8,9,7,8,8
2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9
Χ1 = 116 / 15 = 7,73 Χ2 = 114/ 15 =7,6
S1 = Ö 1/14*28,4 = Ö 2,02 = 1,42
S2 = Ö 1/14*13,6= Ö0,9714 = 0,986
ν1= (12 – 7,73) / 1,42 = 3,001
ν2= (9-7,6) / 0,986 = 1,42
να= 3,07
ν1 < να , следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.
ν2 < να , следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.
Для сравнения дисперсий двух выборок по методу Фишера используется
F –распределение F (k1,k2) , где k1 и k2 степени свободы, k1 = n – 1 и
k2 = n – 1.
Критерий Фишера рассчитывается по формуле:
Fэ = S²1 / S²2
Где S1> S2
Fэ =2,02 /0,972 = 2,08
Fэ таб = 2,4
Fэ < Fэ таб , следовательно расхождение дисперсий носит случайный характер, выборки можно объединить в одну совокупность и приступить к оценке средних значений с помощью критерия Стьюдента.
Рассчитываем величину t:
t =(|Χ1 – Χ2| /Ö n1*s1² + n2*s2²)Ö n1* n2*(n1+ n2 – 2)/n1+ n2 ,
где s1²,s2² - смещенные оценки дисперсии
s² = 1/n Σ (Χi – Χ)²
s1² = 1/15 * 28,4 = 1,893
s2² = 1/15 * 13,6 = 0,906
t = 0.13/6,48 *√ 210 = 0,02*14.49 = 0.3
tтаб = 1,32
tрасч < tтаб , следовательно, выборки данных являются непротиворечивыми и объединяются в одну совокупность.
Задание № 2
Сделать прогноз, используя метод наименьших квадратов и метод экспоненциального сглаживания. Произвести комбинированную оценку прогноза.
Объем перевозок автомобильным транспортом РФ, млн.т. = yt
Таблица 1
yt | 100 | 129
| 168 | 153 |
t | 1 | 2 | 3 | 4 |
Принимаем, что модель тренда является линейной.
y٭ = a + b * t
a = (Σ yi * Σ ti - Σ ti * Σ (yi * ti )) / n * Σ t²i - (Σ ti )²
b = (n * Σ( ti * yi ) - Σ ti * Σ yi ) / n * Σ t²i - (Σ ti )²
a = (550 * 30 – 10 * 1474) / 4 * 30 – 100 = 88
b = ( 4* 1474 – 10*550) / 4 * 30 – 100 = 19,8
a =88 b = 19,8
y1 = 88 + 19,8*1 = 107,8
y2 = 88 + 19,8*2 = 127,6
y3 = 88 + 19,8*3 = 147,4
y4 = 88 + 19,8*4 = 167,2
Для определения основной ошибки прогноза используется зависимость :
st = √ Σ (y٭ – yt)² / n-1
st = √688,8/3 = 15,15
Для прогнозирования методом экспоненциального сглаживания используется полученная ранее линейная модель тренда, определяется параметр сглаживания
(α) и начальные условия (S¹0 , S²0 ):
α = 2/ n+1
α = 0.4
S¹0 = a –((1-α)/ α )*b)
S²0 = a –((2*(1-α)/ α )*b)
S¹0 = 88 – 23,76=64,24
S²0 =88 – 59,4=28,6
Вычисляем экспоненциальные средние 1 и 2 порядка :
S¹t = α * yt +(1- α)* S¹t-1
S²t = α * S¹t + (1- α) * S²t-1,
а значения коэффициентов для «сглаженного» ряда:
a= 2* S¹t - S²t ;
b= α / (1- α )*[S¹t - S²t ]
Прогноз на t + l год определяется по формуле:
y´t+l = a+ b* l ,
где l – переменная «сглаженного» ряда.
Таблица 2
Период времени | Факт. значение | Расчетные значения | |||||
S¹t | S²t | a | b | yt | Δ y = yt- yt
| ||
1 | 100 |
|
|
|
|
|
|
2 | 129 | 78,5 | 48,5 | 108,5 | 20 | 128,5 | -0,5 |
3 | 168 | 98,7 | 68,6 | 128,8 | 20,07 | 148,9 | -19,12 |
4 | 153 | 126,4 | 91,7 | 161,1 | 23,2 | 184,3 | 31,3 |
l =1 | - | 137,1 | 109,9 | 164,3 | 18,1 | 182,4 | - |
Ошибка прогноза рассчитывается по следующей формуле: