Сравнивая, среднюю арифметическую по исходным данным с аналогичным показателем, рассчитанным для интервального ряда(59,2) видим, что значение по исходным данным более точное.
Связано с нессиметричным распределением значений внутри интервала. И на значение средней арифметической по исходным данным это не влияет.
Задание 2
По исходным данным :
1. Установите наличие и характер связи между признаками –валовой доход и расходы на продукты питания в среднем на одного члена домохозяйства в год:
а) аналитической группировки
б) корреляционной таблицы.
2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициентов детерминации и эмпирического корреляционного отношения.
Сделайте выводы по результатам выполненного задания.
Решение
1. Аналитическая группировка позволяет изучать взаимосвязь факторного (валовой доход ) и результативного (расходы на продукты питания в среднем на одного члена домохозяйства) признаков.
Для установления наличия и характера связи строим итоговую аналитическую таблицу.(см.табл.6)
Таблица 6
Зависимость расходов на продукты питания от валового дохода домохозяйств данного региона в отчетном году
Номер группы | Группировка домохозяйств по валовому доходу | Количество домохозяйств, штf | Валовой доход, тыс. руб. | Расходы на продукты питания , тыс .руб. | ||
Всего | Средний валовой доход, тыс. руб.. | Всего | В среднем на одно домохозяйство | |||
1 | 28-40 | 3 | 87 | 34 | 48 | 16 |
2 | 40-52 | 5 | 230 | 46 | 105 | 21 |
3 | 52-64 | 12 | 696 | 58 | 300 | 25 |
4 | 64-76 | 6 | 420 | 70 | 165 | 27,5 |
5 | 76-88 | 4 | 340 | 82 | 132 | 33 |
Всего | 30 | 1773 | 750 |
Вывод: с увеличением валового дохода увеличиваются и расходы на продукты питания. Связь прямая.
Найдем интервал для результативного признака
где ymax,ymin–наибольшее и наименьшее значение признака (расходы на продукты питания), n-число групп (5).
xmax=35, xmin=15, n=5
2. Корреляционная таблица-это специальная комбинированная таблица, в которой представлена группировка по двум взаимосвязанным признакам: факторному (валовой доход) и результативному (расходы на продукты питания) (см. табл.7).
Таблица 7
Распределение домохозяйств по валовому доходу и расходам на продукты питания
Группы домохозяйств по валовому доходу | Группы домохозяйств по расходам на продукты питания | ||||
15-19 | 19-23 | 23-27 | 27-31 | 31-35 | |
28-40 | 11,17,21 | ||||
40-52 | 2 | 14,6,23,10 | |||
52-64 | 1 | 16,18,9,22,1215,3,28,5,30 | |||
64-76 | 13 | 4,7,19,29,26 | |||
76-88 | 25 | 27,20,8 |
Вывод: Распределение предприятий произошло вдоль диагонали, проведенной из верхнего левого угла таблицы в нижний правый., т.е. увеличение признака «валовой доход» сопровождалось увеличение признака «расходы на продукты питания». Это свидетельствует о наличии прямой корреляционной связи между изучаемыми признаками.
3. Эмпирическое корреляционное отношение рассчитывается по формуле
, где -межгрупповая дисперсия, характеризующая величину из квадрат отклонения групповых средних от общего среднего результативного признака. -общая дисперсия, показывающая среднюю величину из квадратов отклонений значения результативного признака от их среднего уровня.Построим таблицу для вычисления общей дисперсии (см. табл.8)
Таблица 8
Таблица данных для определения общей дисперсии
N,п/п | Расходы на продукты питания | |
1 | 21 | 441 |
2 | 16 | 256 |
3 | 26,1 | 681,21 |
4 | 28 | 784 |
5 | 26 | 676 |
6 | 22,5 | 506,25 |
7 | 27,6 | 761,76 |
8 | 35 | 1225 |
9 | 23,9 | 571,21 |
10 | 22,5 | 506,25 |
11 | 15 | 225 |
12 | 25,2 | 635,04 |
13 | 29 | 841 |
14 | 21,4 | 457,96 |
15 | 24,9 | 620,01 |
16 | 24,8 | 615,04 |
17 | 16 | 256 |
18 | 23,6 | 556,96 |
19 | 27,2 | 739,84 |
20 | 35 | 1225 |
21 | 17 | 289 |
22 | 23,8 | 566,44 |
23 | 22,6 | 510,76 |
24 | 25 | 625 |
25 | 27 | 729 |
26 | 30 | 900 |
27 | 35 | 1225 |
28 | 25,4 | 645,16 |
29 | 27,2 | 739,84 |
30 | 26,3 | 691,69 |
Всего | 750 | 19502,42 |
Общая дисперсия результативного признака вычисляется по формуле:
=Межгрупповая дисперсия вычисляется по формуле:
Построим вспомогательную таблицу для вычисления данных (см. табл.9)
Таблица 9
Таблица данных для расчета межгрупповой дисперсии
Номер группы | Группировка домохозяйств по валовому доходу | Количество домохозяйств, шт | Расходы на продукты питания , тыс .руб | ||||
Всего | В среднем на одно домохозяйство | ||||||
f | |||||||
1 | 28-40 | 3 | 48 | 16 | -9 | 81 | 243 |
2 | 40-52 | 5 | 105 | 21 | -4 | 16 | 80 |
3 | 52-64 | 12 | 300 | 25 | 0 | 0 | 0 |
4 | 64-76 | 6 | 165 | 27,5 | 2,5 | 6,25 | 37,5 |
5 | 76-88 | 4 | 132 | 33 | 8 | 64 | 256 |
Всего | 30 | 750 | 616,5 |
Вывод: связь между факторами весьма тесная, т.к. принимает значения от 0,9 до 0,99.
Коэффициент детерминации – это квадрат эмпирического корреляционного отношения. Следовательно,
(81,9%)Вывод: выпуск продукции на данных предприятиях на 81,9% зависит от фондоотдачи и на 18,1 % от других факторов.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,9543 определите:
1. Ошибку выборки среднего валового дохода на одного члена домохозяйства в год и границы, в которых будет он находиться в генеральной совокупности.
2. Ошибку выборки доли домохозяйств с уровнем валового дохода менее 52 тыс руб. и более млн. руб. и границы, в которых будет находиться генеральная доля.
Решение:
1. Ошибка выборки для средней определяем по формуле:
, где дисперсия выборочной совокупности;n- численность выборки;
t- коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной вероятности. В данном случае при Р=0,954 значение t=2.
N-число единиц в генеральной совокупности, N=6000 шт.
Рассчитаем дисперсию. Данные представим в виде таблицы (см. табл.11).
Таблица 11
Данные для расчета дисперсии уровня фондоотдачи
Номер группы | Группировка домохозяйств по валовому доходу | Количество домохозяйств, шт | *f | |||
f | ||||||
1 | 28-40 | 3 | 34 | -25,1 | 630,01 | 1890,03 |
2 | 40-52 | 5 | 46 | -13,1 | 171,61 | 858,05 |
3 | 52-64 | 12 | 58 | -1,1 | 1,21 | 14,52 |
4 | 64-76 | 6 | 70 | 10,9 | 118,81 | 712,86 |
5 | 76-88 | 4 | 82 | 22,9 | 524,41 | 2097,64 |
Всего | 30 | 5573,1 |