Смекни!
smekni.com

Контрольно-измерительные материалы КИМы и интерпретация результатов тестирования (стр. 2 из 6)


2. Статистические характеристики теста

После сбора эмпирических данных начинается этап математико-статистической обработки, которая проводится, как правило, с помощью специального программного обеспечения. В практическом плане применение программного обеспечения сопряжено с некоторыми трудностями. В частности, необходимо использование компьютерной техники, приобретение программных продуктов, создание специальной группы технического сопровождения. Однако, как показывает опыт, все эти трудности могут быть преодолены даже силами небольшого преподавательского коллектива, особенно в тех случаях, когда подсчет статистики осуществляется на небольших выборках в 50-100 человек.

Этап математико-статистической обработки можно разбить на 10 шагов.

Первый шаг. Первый шаг связан с формированием матрицы тестовых результатов, в которой количественные данные представляются в систематизированной и сжатой форме, чтобы обеспечить их дальнейшую обработку и интерпретацию. Формирование матрицы начинается с выбора определенного правила для оценки ответов учеников на задания теста. Обычно результаты ответов оцениваются дихотомически, а именно за каждый правильный ответ учащийся получает один балл, а за неправильный ответ или за пропуск задания — нуль баллов.

Если символом Ху обозначить результат выполнения Х-м испытуемым у-го задания теста, то в сокращенной форме приведенное выше правило можно записать в виде:

l, если ответ Х-го испытуемого на у-е задание верный;

0, если ответ Х-го испытуемого на у-е задание неверный.

После выбора оценочного правила эмпирические данные сводятся в матрицу. Строки матрицы, состоящие из нулей и единиц, соответствуют ответам учеников на различные задания теста. По столбцам располагаются профили ответов испытуемых на каждое задание теста.

Из дидактических соображений для иллюстрации математико-статистических методов выбрана небольшая матрица, когда 12 учеников отвечали всего на 10 заданий теста (табл. 2.1).

Однако все формулы и подсчеты, обсуждаемые в разделе, могут быть распространены на любые выборки испытуемых и применимы к тестам любой длины.

Второй шаг. На втором шаге из матрицы тестовых результатов устраняются строки и столбцы, состоящие только из нулей или только из единиц. В приведенном выше примере таких столбцов нет, а строк только две, последние в матрице тестовых результатов. Одна из них, нулевая строка, соответствует ответам 11-го испытуемого, который не смог выполнить правильно ни одного задания в тесте. В этом случае вывод довольно однозначен. Если сложилась такая ситуация, то тест непригоден для оценки знаний 11-го ученика. Для выявления его уровня знаний тест необходимо облегчить, добавив несколько очень легких заданий, которые, скорее всего, большинство остальных испытуемых группы выполнит правильно.

Таблица 2.1. Матрица результатов тестирования

Номер испытуемого i Номер задания j
1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 0 0 0 0
2 1 1 0 0 0 0 0 0 0 0
3 0 0 0 0 0 0 0 1 0 0
4 1 1 0 1 1 1 1 1 1 1
5 1 0 1 0 1 1 0 0 0 0
6 1 1 1 0 0 0 0 1 0 0
7 1 1 1 1 0 1 0 0 0 0
8 1 1 1 1 0 0 0 0 0 0
9 1 1 1 1 1 1 1 1 1 0
10 1 1 1 1 1 0 1 0 0 0
11 0 0 0 0 0 0 0 0 0 0
12 1 1 1 1 1 1 1 1 1 1

Столь же непригоден, но уже по другой причине тест для оценки знаний 12-го ученика, который выполнил правильно все без исключения задания теста. Причина непригодности теста — его излишняя легкость, не позволяющая выявить истинный уровень подготовки 12-го ученика. Его результаты указывают лишь на знание предложенного в тесте материала, но не позволяют установить границу между освоенным и неосвоенным содержанием курса. Возможно, 12-й ученик знает много чего другого и в состоянии выполнить по контролируемым разделам содержания гораздо более трудные задания, которые просто не были включены в тест. В эту, казалось бы, привычную для традиционного контроля и желаемую для педагога ситуацию, когда испытуемый справился со всем объемом контролируемого материала, необходимо привнести элементы тестовой науки. Хотя традиционный и тестовый контроль служат одной и той же цели – оценке знаний испытуемых, между ними есть существенные различия не только по форме проведения, но и по качеству получаемых оценок. В отличие от традиционных тестовые методы контроля позволяют ответить на наиболее важный вопрос: насколько точна оценка знаний каждого испытуемого и следует ли ей вообще доверять?

Сама по себе постановка вопроса никак не связана с недостатками тестовых методов, поскольку ошибка (погрешность) измерения существует всегда и везде. В том числе и в процессе тестовых измерений возникает ряд погрешностей, мешающих получить истинные баллы учеников. Существование погрешностей приводит к мысли об относительной точности оценок, которая варьирует и которую можно счесть как достаточной, так и не позволяющей доверять полученным оценкам.

Обычно, если нормативно-ориентированный тест сделан хорошо, то достаточной точностью обладают примерно 70% результатов, находящихся в центре распределения, а примерно 5% самых слабых и 5% самых сильных результатов вообще нельзя доверять, так как они отражают истинный уровень знаний учеников с очень большой ошибкой измерения. Именно по этим соображениям профессионально организованные тестовые службы при обработке отбрасывают не менее 3 или 5% результатов на концах распределения. К сожалению, в нашей стране зачастую тестовые оценки испытуемых выставляются без учета теоретических ограничений на возможные диапазоны их применения.

Причина такого положения – практическое незнакомство большинства преподавателей с основами тестовой теории, незнание основных ее положений. Особенно пагубно это незнание сказывается на качестве тестов, разрабатываемых в нашей стране. Нередко автор теста, если его выполнили все или почти все испытуемые группы, расценивает свою работу как успех. У этой тенденции есть свои печальные следствия. Тестовые оценки, полученные со значительной ошибкой измерения, порождают у преподавателей многочисленные сомнения в возможностях педагогических тестов. В сущности, здесь виноваты не тесты, а отсутствие должного профессионализма их разработчиков, но об этом почему-то никто не думает, особенно в тех случаях, когда ругают педагогические тесты.

При правильном положении вещей последние две строки матрицы должны быть удалены, и матрица тестовых результатов примет вид, приведенный в табл. 2.2.

Таблица 2.2. Матрица результатов после удаления строк

Номер испытуемого i Номер задания у
1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 0 0 0 0
2 1 1 0 0 0 0 0 0 0 0
3 0 0 0 0 0 0 0 1 0 0
4 1 1 0 1 1 1 1 1 1 1
5 1 0 1 0 1 1 0 0 0 0
6 1 1 1 0 0 0 0 1 0 0
7 1 1 1 1 0 1 0 0 0 0
8 1 1 1 1 0 0 0 0 0 0
9 1 1 1 1 1 1 1 1 1 0
10 1 1 1 1 1 0 1 0 0 0

Третий шаг. Третий шаг связан с подсчетом индивидуальных баллов испытуемых и количеством правильных ответов испытуемых на каждое задание теста. Индивидуальный балл испытуемого получается суммированием всех единиц, полученных им за правильно выполненные задания теста. Например, 4-й испытуемый выполнил правильно 9 заданий, поэтому его индивидуальный балл равен 9. В строке ответов 2-го испытуемого стоят всего две единицы — его индивидуальный балл Х2 = 2. Для удобства полученные индивидуальные баллы Xi (i= 1, 2,..., 10) приводятся в последнем столбце матрицы результатов (табл. 2.3).

Таблица 2.3.

Матрица результатов с индивидуальными баллами испытуемых и количеством правильных ответов на задания теста

Номер испытуемого i Номер задания j Индивидуальный балл (множество Аj)
1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 0 0 0 0 6
2 1 1 0 0 0 0 0 0 0 0 2
3 0 0 0 0 0 0 0 1 0 0 1
4 1 1 0 1 1 1 1 1 1 1 9
5 1 0 1 0 1 1 0 0 0 0 4
6 1 1 1 0 0 0 0 1 0 0 4
7 1 1 1 1 0 1 0 0 0 0 5
8 1 1 1 1 0 0 0 0 0 0 4
9 1 1 1 1 1 1 1 1 1 0 9
10 1 1 1 1 1 0 1 0 0 0 6
Число правильных ответов (множество Аi) 9 8 7 6 5 5 3 4 2 1 50

Число правильных ответов на задания Х также получается суммированием единиц, но уже расположенных по столбцам. Например, в 1-м столбце стоят 9 единиц — число испытуемых, правильно ответивших на 1-е задание, равно 9. На последнее, 10-е задание ответил правильно только один ученик, поэтому Х10= 1. Число правильных ответов на каждое задание также помещается в матрицу результатов, обычно оно располагается в последней строке под номером соответствующего задания теста (см. табл. 3).