Пример 4.9. Имеется следующий ряд распределения работников по стажу
Стаж, г. | Число работников, чел. |
2-55-88-11 | 452 |
Итого | 11 |
Определить:
- размах вариации
- дисперсию
- среднее квадратическое отклонение
- коэффициент вариации
Решение:
1. Размах вариации
летРазмах вариации лучше определять по первичным данным, что мы уже делали при расчете величины интервала группировки
(см. пример 2.1). Для расчета остальных показателей оформим рабочую таблицуСтаж, лет | Число работников, чел | |||
2-55-88-11 | 452 | 3,56,59,5 | 14,032,519,0 | (3,5-5,955)2∙4=24,108(6,5-5,955)2∙5=1,48525,134 |
Итого | 11 | 65,5 | 50,727 |
Дисперсия равна:
Среднее квадратическое отклонение равно
Коэффициент вариации равен
%Анализ полученных данных говорит о том, что стаж работников предприятия отличается от среднего стажа
в среднем на 2,147 года или на 43,3%. Коэффициент вариации превышает 33%, и 40%, следовательно, вариация производственного стажа умеренная, найденный средний стаж плохо представляет всю совокупность работников, не является ее типичной, надежной характеристикой, а саму совокупность нет оснований считать однородной по производственному стажу.5. Виды дисперсий
Правило сложения дисперсий. Коэффициент детерминации и эмпирическое корреляционное отношение
В статистике важно рассчитывать дисперсии для результативного признака
, опираясь на данные аналитической группировки.В этом случае дисперсии примут вид:
- общая дисперсия
- внутригрупповые дисперсии
(14)- средняя из внутригрупповых дисперсий
(15)- межгрупповая дисперсия
(16)где
- общая средняя - средняя -ой группыПравило сложения дисперсий
(17)На основе этого правила рассчитывают эмпирические показатели тесноты корреляционной связи между факторным и результативным признаками.
Если учесть, что величина межгрупповой дисперсии характеризует влияние только факторного признака, а величина общей дисперсии помимо факторного признака характеризует влияние и всех остальных признаков, то отношение межгрупповой дисперсии к общей покажет силу влияния факторного признака на результативный.
Это отношение называют коэффициентом детерминации
(18)Корень квадратный из коэффициента детерминации называют эмпирическим корреляционным отношением.
(19)Оно показывает степень тесноты связи между факторным и результативным признаком и изменяется в пределах от 0 до 1. Нулевое значение говорит о том, что связи нет (тогда межгрупповая дисперсия равна 0). Значение 1 указывает на наличие функциональной зависимости между признаками, при которой значения исследуемого показателя полностью определяются значениями факторного (группировочного) признака (средняя из внутригрупповых дисперсий в этом случае принимает нулевое значение). И естественно, чем ближе
к 1, тем связь теснее. Для аналитической характеристики степени связи используют шкалу Чэддока0 | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,999 | 1 | |
сила связи | отсутствует | слабая | умеренная | заметная | тесная | весьма тесная | функциональная |
Проиллюстрируем расчеты по данным и результатам расчета примера 2.2.
Пример 4.10. Имеются следующие данные о зависимости выработки работников от их производственного стажа.
Стаж, г. | Число работников, чел. | Выработка изделий в среднем на работника, шт. |
2-55-88-11 | 452 | 7,08,411,0 |
Итого | 11 |
Опираясь на данные представленной таблицы и на исходные данные примера 2.2. определить коэффициент детерминации и эмпирическое корреляционное отношение.
Решение
Вычислим межгрупповую дисперсию по формуле (16)
.Расчеты произведем в таблице
Стаж, лет | Число работников, чел. | Средняя выработка | |
2-55-88-11 | 452 | 7,08,411,0 | (7-8,364)2∙4=7,442(8,4-8,364)2∙5=0,006(11-8,364)2∙2=13,897 |
Итого | 11 | 21,345 |
Теперь вычислим общую дисперсию выработки изделий на основе индивидуальных данных примера 2.2 по формуле (13)
Для этого вначале возведем данные выработки в квадрат.
Выработка изделий, шт. | |
1 | 2 |
107 | 10049 |
7698129879 | 4936816414481644981 |
Итого | 798 |
Тогда
или 74,9% =0,865Величина коэффициента детерминации говорит о том, что вариация выработки изделий на 74,9% зависит от вариации производственного стажа работников и на 25,1% от прочих признаков.
Величина эмпирического корреляционного отношения (0,865) свидетельствует о тесной взаимосвязи между стажем работников и их выработкой.
6. Дисперсия альтернативного признака
Частный случай атрибутивного (неколичественного) признака – признак альтернативный. Когда единицы совокупности либо имеют данный изучаемый признак, либо не имеют его. Примером таких признаков является: наличие бракованной продукции, ученая степень у преподавателей вуза, работа по полученной специальности, превышение среднедушевых денежных доходов их общероссийского уровня, наличие детей в семье и т.д.
В случае наличия альтернативного признака единице совокупности присваивается значение «1». В случае отсутствия – «0».
Весами в расчетах служат:
- доля единиц обладающих данным признаком; - доля единиц, не обладающих данным признакомТогда средняя величина альтернативного признака равна:
дисперсия примет вид:
Дисперсия альтернативного признака изменяется в пределах от 0 до 0,25. Максимального значения 0,25 достигает при
0,5Пример 4.11. При выборочном опросе 300 жителей Курска 60 из них высказались положительно по поводу хранения личных денежных сбережений в коммерческих банках города