Таблица 1.1.3
Распределение цветовой окраски последовательного образа
после предъявления испытуемому красного цвета
Последовательный образ (Х) | Частота называния цвета образа (¦) |
16 17 18 19 20 21 22 23 | 2 7 15 26 22 15 8 1 |
å¦: | 96 |
Рис. 1.1.3. Гистограмма (ступенчатая диаграмма) распределения первичных результатов исследования цвета последовательных образов (см. табл. 1.1.3).
От гистограммы легко перейти к построению частотного полигона распределения, а от последнего - к кривой распределения. Частотный полигон строят, соединяя прямыми отрезками верхние точки центральных осей всех участков ступенчатой диаграммы (рис. 1.1.4). Если же вершины участков соединить с помощью линий, то получится кривая распределения первичных результатов (рис. 1.1.5). Переход от гистограммы к кривой распределения позволяет путем интерполяции находить те величины исследуемой переменной, которые в опыте не были получены.
Рис. 1.1.4. Полигон частотного распределения первичных результатов исследования цвета последовательных образов (см. табл. 1.1.3 и рис. 1.1.3). | Рис. 1.1.5. Кривая распределения первичных результатов исследования цвета последовательных образов (см. табл. 1.1.3 и рис. 1.1.4). |
Группировка первичных результатов. Довольно часто при построении гистограмм на основе первичных данных несколько значений переменной Х могут оказаться нулевыми. Для избежания таких перерывов в гистограмме рекомендуется произвести группировку первичных результатов. Под группировкой понимается объединение нескольких значений переменной Х в один общий разряд. Существуют точные формулы определения числа разрядов, или классов группировки, и их диапазона, т. е. ширины класса. Однако группировка возможна только при достаточно большом числе экспериментальных данных или наблюдений. В большинстве случаев исходят из следующего эмпирического правила: при числе данных, значительно превышающем 25, целесообразно их группировать не менее чем в 10 и не более чем в 20 классов. При этом в качестве величин, характеризующих ширину класса группировки, используют следующие величины: 1; 2; 3; 5; 10; 20.
Для разъяснения процедуры группировки обратимся к числовому примеру. Допустим, что приведенные ниже числа образуют так называемый массив данных, т. е. характеризуют все правильные ответы испытуемых на некоторый психологический тест:
25; 33; 35; 37; 55; 27; 40; 33; 39; 28;
34; 29; 44; 36; 22; 51; 29; 21; 28; 29;
33; 42; 15; 36; 41; 20; 25; 38; 47; 32;
15; 27; 27; 33; 46; 10; 16; 34; 18; 14;
46; 21; 19; 26; 19; 17; 24; 21; 27; 16.
Для группировки в этом массиве данных прежде всего необходимо найти в нем максимальное (55) и минимальное (10) числа и на основе их разности определить размах распределения (55-10=45). Вполне очевидно, что для получения не менее чем 10 классов группировки, ширина класса в нашем примере должна быть не меньше 5. Далее необходимо установить границы классов группировки, причем таким образом, чтобы и максимальное (55) и минимальное (10) числа из массива данных попали в нижний и верхний классы. Для этого построим табл. 1.1.4.
Таблица 1.1.4
Группировка первичных результатов психологического исследования
Классы группировки | Границы классов | Точные границы классов | Центры классов (Х1) | Первичные распределения | Частота встречаемости (¦) |
10 9 8 7 6 5 4 3 2 1 | 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 | 54,5-59,5 49,5-54,5 44,5-49,5 39,5-44,5 34,-39,5 29,5-34,5 24,5-29,5 19,5-24,5 14,5-19,5 9,5-14,5 | 57 52 47 42 37 32 27 22 17 12 | 1 1 111 1111 111111 1111111 111111111111 111111 11111111 11 | 1 1 3 4 6 7 12 6 8 2 |
å¦ = 50
Рассмотрим более подробно каждую из граф табл. 1.1.4. В 1-й графе указывают число классов группировки. Классу, содержащему минимальные величины массива первичных данных, присваивают номер 1, последующим - последующие порядковые номера до п классов. Во 2-й графе указывают, каким образом определены классы группировки. А именно: на основе числа 5 как характеристики ширины класса было образовано 10 классов группировки (10-й класс: 59, 58, 57, 56, 55; 9-й класс: 54, 53, 52, 51, 50 и т. д.).
Мы помним, что в данном случае рассматриваем не дискретно, а непрерывно распределенные величины, и поэтому целесообразно ликвидировать возникшую разрывность между ними. В качестве первого шага на этом пути необходимо определить точные границы классов группировки (3-я графа). Исходя из того что величины в интервале между более высоким и более низким классами группировки распределены равномерно, каждая из точных границ классов может быть определена значением средней арифметической величины между верхней границей более низкого класса и нижней границей более высокого класса. В качестве второго шага с целью ликвидации разрывности данных следует рассчитать центральные значения классов Хi. Они соответствуют средней арифметической величине между нижней и верхней границами классов и указаны в 4-й графе таблицы. Сравнивая верхнюю границу предшествующего класса группировки с нижней границей последующего класса, можно видеть, что дискретность в ряду исчезла и, следовательно, ряд величин стал непрерывным.
Таким образом, первые графы таблицы служат основанием для группировки первичных результатов. В дальнейшем будет видно, что они совершенно необходимы также для расчета ряда статистических показателей. Характер распределения первичных результатов показан в 5-й графе, а частота встречаемости (f) - в 6-й.
В некоторых случаях результаты исследования полезно представить графически, в виде кривой так называемых накопленных частот (fcum), а также в виде процентной суммы этих частот. Чтобы показать, как это делают, обратимся снова к данным табл. 1.1.4 и воспроизведем из нее графы 3-ю и 6-ю в табл. 1.1.5. Из таблицы видно, что величины накопленных частот (4-я графа) получают путем последовательного суммирования (снизу вверх) исходного распределения частот (3-я графа). Процентную сумму накопленных частот получают, разделив значение каждой накопленной частоты на общее число данных (в нашем примере оно было равно 50) и умножив частное на 100. Необходимо при этом помнить, что процентная сумма накопленных частот в каждом классе группировки относится к верхней границе данного класса. Это означает, что ниже, например, границы 5-го класса находится 35, или 70%, случаев всех наблюдений. Гистограмму и ход кривой накопленных частот, а также суммы накопленных частот можно представить графически (рис. 1.1.6).
Таблица 1.1.5
Расчет накопленных частот и процентной суммы накопленных частот
Классы группировки | Точные границы классов | Частоты данных (¦) | Накопленные частоты (¦cum) | Процентная сумма накопленных частот (%) |
10 9 8 7 6 5 4 3 2 1 | 54,5-59,5 49,5-54,5 44,5-49,5 39,5-44,5 34,5-39,5 29,5-34,5 24,5-29,5 19,5-24,5 14,5-19,5 9,5-14,5 | 1 1 3 4 6 7 12 6 8 2 | 50 49 48 45 41 35 28 16 10 2 | 1,00´100=100 0,98´100=98 0,96´100=96 0,90´100=90 0,82´100=82 0,70´100=70 0,56´100=56 0,32´100=32 0,20´100=20 0,04´100=4 |