Для формулировки окончательного вывода необходимо рассчитать критерии c-квадрат - критерий согласия Пирсона.
; (2.13).где: k - количество интервалов;
fi - эмпирическая частота j-го интервала;
fit - теоретическая частота j-го интервала.
Tеоретические частоты определяются по формуле:
; (2.14).где ti - центрированные и нормированные значения:
; (2.15).d- среднеквадратическое отклонение.
Правило проверки заключается в следующем. Определяем по таблице распределения c - квадрат критическое значение
для числа степеней свободы m=k-2 и заданного уровня значимости a=0.05. Затем сравниваем расчетное и критическое значения критерия Пирсона. Если , то выдвинутая гипотеза о нормальном распределении интервального ряда не отвергается (не противоречит опытным данным) с вероятностью ошибки a=0.05.2.1.4. Графическое изображение интервального ряда
Для визуального наблюдения характера распределения частот, определения положения среднего значения
, моды MO, медианы ME и характера рассеивания значений дисперсии d2 и среднеквадратичного отклонения d интервальные ряды изображают графически. Для этого строятся следующие диаграммы - гистограмма, полигон частот и кумулятивная кривая.При построении гистограммы по оси абсцисс прямоугольной системы координат откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов пропорциональна частотам. В случае неравных интервалов высота столбиков пропорциональна относительным частотам (частостям).
При построении полигона частот по оси абсцисс прямоугольной системы координат откладываются средние значения интервалов, по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении абсцисс и ординат точки соединяют прямыми линиями, в результате получают ломанную, называемую полигоном частот.
При построении кумулятивной кривой по оси абсцисс откладываются величины интервалов, по оси ординат накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Эти перпендикуляры соединяют и получают ломанную линию - кумулятивную кривую.
Алгоритм выполнения лабораторной работы покажем на примере данных, представленных на рис 6.1.
2.2.1.С использованием табличного процессора Excel.
2.2.1.1. Построение интервального ряда.
1.Открываем новый рабочий лист электронной таблицы. В блок ячеек A5:J14 заполняем значения исходного ряда (см. рис.6.1). Расположение блоков с промежуточными данными и результатами вычислений представлено на рис.2.1.
2. Определяется количество групп К. Значение К округляется до большего нечетного целого. Для определения большего целого от вещественного числа используется встроенная функция ОКРВВЕРХ(). Для вычисления логарифма от объема выборки используется функция LOG10(). Для вычисления К в ячейку G18 (см. рис.2.3) записывается следующая формула:
ОКРВВЕРХ(1+3,3222*LOG10(G17);1).
3. Определение минимального и максимального значений xmin, xmax осуществляется с использованием встроенных функций МАКС(A5:J14) и МИН(A5:J14), записываемые в ячейки G19 и G20;
4. Определение размаха варьирования признака R, в ячейку G21 вводится формула =G19-G20;
5. Вычисляется длина интервала h, в ячейку G22 вводится формула =G21/G18;
6. Вычисляются начальное и конечное значения соответственно первого и последнего интервалов xo, xk. В ячейку G23 вводится формула =G20-G22/2. В ячейку G24 вводится формула =G19+G22/2.
Значения
представить в расчетном блоке в виде таблицы (табл.3.4 рис.2.1)7. Далее приступаем к построению интервального ряда, который на рис.2.1 представлен в виде результирующей таблицы (табл.3.5). Колонка "интервал" результирующей таблицы содержит верхние граничные значения интервалов. Определение их выполняется следующим образом. В первую ячейку колонки "интервал" (в ячейку B31) ввести значение x0, выделить блок для заполнения значений интервалов, т.е. колонку, содержащую к+2 ячеек (блок B30:B39), выполнить команду /Правка/заполнить/прогрессия/арифметическая. По этой команде раскрывается диалог рис.2.2, в котором устанавливаются следующие опции: Расположение - по столбцам, Тип - арифметическая. В строке ввода Шаг ввести значение h, в строке ввода Предельное значение ввести значение xk , затем нажать кнопку ОК.
8. Определение частот. Выделить массив ячеек (колонку "частота"). Размер выделенного блока должен быть равен размеру заполненной колонки "интервал". Выполнить команду /Встроить/функцию или нажать кнопку Мастер функции fx . Открывается диалоговое окно Мастер функций в положении “шаг 1 из 2”, в котором выбрать функцию /Статистические/частота. После этого раскрывается диалоговое окно для установки параметров рис. 2.3. В строку ввода Массив данных ввести координаты блока ячеек (в рассматриваемом примере блок [A5:J14]), содержащего исходный массив данных). В строку ввода Двоичный массив ввести координаты блока ячеек со значениями интервалов (в примере блок [B30:B39]). Нажать кнопку ОК. После этого нажать клавишу [F2] (редактирование) и затем нажать комбинацию клавиш Ctrl + Shift + Enter. Частота в i-ой строке fi соответствует интервалу [xi-1;xi].9. Для расчета относительной частоты wi, накопленной частоты Si, середины интервалов xSRi, абсолютной плотности mai, относительной плотности moi во вторые ячейки каждой колонки вводится соответствующая формула (первая строка таблицы частот имеет нулевую частоту, т.е. является не информативной). Затем производится копирование формул на всю колонку командой /Правка/копировать.
Замечания по вводу формул:
- формула для частости wi=fi/n должна иметь абсолютную ссылку на ячейку, содержащую значения n. При расположении блоков данных так как на рис.2.1 в ячейку D31 вводится следующая формула =C31/$G$17;
- для определения накопленной частоты используется встроенная функция СУММ(). Установить курсор в ячейку E31 и вызвать функция СУММ() с помощью команды меню /Вставка или кнопки Мастера функций. Аргументом функции является блок ячеек, состоящий из одной ячейки, в качестве которой будет вторая ячейка колонки
"частота". Первая координата блока должна быть абсолютной (фиксированной), вторая - относительной. Поэтому при копировании формулы в последующие ячейки происходит вычисление суммы с накоплением. В рассматриваемом примере формула во второй ячейке колонки "накопленная частота" E31 имеет вид СУММ($C$31:C31).- при вычислении середины интервала xSRi=(xi-1+xi)/2 во вторую ячейку этой колонки (ячейку F31) вводится формула =(B30+B31)/2.
- формулы для абсолютной плотности mai=fi/h и для относительной плотности moi=wi/h должны иметь абсолютную ссылку на ячейку, содержащую значение интервала h. Соответственно в ячейки G31 и H31 вводятся следующие формулы =C31/$G$22 и =D31/$G$22.
10. В Excel группировку можно выполнить с помощью команды /Cервис/анализ данных/гистограмма. При этом раскрывается диалоговое окно рис.2.4. В строке ввода Входной диапазон указываются координаты блока исходного ряда [A5:J14]; в строке Интервал карманов - координаты блока значений интервалов [B30:B39]; в строке Выходной диапазон – координаты блока результатов J28, которые также показаны на рис. 2.4. Установить флажок в строке Вывод графика для вывода гистограммы.
Результаты выполнения команды /Cервис/анализ данных/гистограмма приведены на рис. 2.5.
2.2.1.2. Статистические характеристики интервального ряда
1. Исходными данными для расчета статистических характеристик интервального ряда является интервальный ряд, полученный в предыдущей пункте.
2. Для удобства вычислений составим вспомогательную таблицу, содержащую промежуточные данные. Ее можно расположить на новом рабочем листе (см. табл.3.6 рис.2.6). Данные колонок xSRi, fi, si копируются в новый рабочий лист из предыдущего листа (табл.3.5 рис. 2.1). Для этого необходимо выполнить следующие действия: выделить копируемый блок ячеек из табл.3.5 рис.2.1, выполнить команду /Правка/копировать, перейти на новый лист, указать блок-получатель (левую верхнюю ячейку), выполнить команду /Правка/специальная вставка/значения.