где
–групповые средние, – общая средняя, –число единиц в j-ой группе,k – число групп.
Для расчета межгрупповой дисперсии
строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по прибыли, млн руб. | Число банков, | Среднее значение в группе | ||
1 | 2 | 3 | 4 | 5 |
50-110 | 3 | 2100 | -2336 | 16370688 |
110-170 | 6 | 3080 | -1356 | 11032416 |
170-230 | 12 | 4340 | -96 | 110592 |
230-290 | 7 | 5694 | 1258 | 11077948 |
290-350 | 2 | 8181 | 3745 | 28050050 |
Итого | 30 | 66641694 |
Расчет межгрупповой дисперсии
по формуле (11): =66641694/30=2221389,8Расчет эмпирического коэффициента детерминации
по формуле (9): =2221389,8/3022333,6=0,735 или 73,5%Вывод. 75,3% вариации суммы прибыли банков обусловлено вариацией объема прибыли, а 24,7% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение
оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле (14)Значение показателя изменяются в пределах
. Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):Таблица 14
Шкала Чэддока
| 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Характеристика силы связи | Слабая | Умеренная | Заметная | Тесная | Весьма тесная |
Расчет эмпирического корреляционного отношения
по формуле (14): =0,857 или 85,7 %Вывод. Согласно шкале Чэддока связь между объемом прибыли и суммой собственного капитала банков является тесной.
ЗАДАНИЕ 3
По результатам выполнения задания 1 с вероятностью 0,683 определите:
1. Ошибку выборки средней прибыли и границы, в которых будет находиться средний размер прибыли в генеральной совокупности.
2. Ошибку выборки доли банков с прибылью 230 и более млн. руб. и границы, в которых будет находиться генеральная доля.
Выполнение Задания 3
3.1 Определение ошибки выборки для средней прибыли банков и границ, в которых будет находиться средний размер прибыли в генеральной совокупности
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности).
Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю
и предельную .Средняя ошибка выборки
- это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[ ].Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.
Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка
выборочной средней определяется по формуле (15)где
– общая дисперсия выборочных значений признаков,N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности.
Предельная ошибка выборки
определяет границы, в пределах которых будет находиться генеральная средняя: , , (16)где
– выборочная средняя, – генеральная средняя.Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.
В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997, реже Р= 0,683.
В математической статистике доказано, что предельная ошибка выборки Δ кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней
это теоретическое положение выражается формулойЗначения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 15):
Таблица 15
Доверительная вероятность P | 0,683 | 0,866 | 0,954 | 0,988 | 0,997 | 0,999 |
Значение t | 1,0 | 1,5 | 2,0 | 2,5 | 3,0 | 3,5 |
По условию выборочная совокупность насчитывает 30 банков, выборка 5% механическая, следовательно, генеральная совокупность включает 600 банков. Выборочная средняя
, дисперсия определены в Задании 1. Значения параметров, необходимых для решения задачи, представлены в табл. 16:Таблица 16
Р | t | n | N | ||
0,683 | 1 | 30 | 600 | 198 | 3956 |
Расчет средней ошибки выборки по формуле (15):