В этой матрице проведено два упорядочения.
Одно касается испытуемых. В первой строке представлены баллы самого успешного испытуемого, во второй менее, и т.д., по нисходящей сумме баллов, если ее посчитать для каждого испытуемого.
Другое упорядочение проведено для заданий. На первом месте стоит самое легкое задание, по которому имеется наибольшее число правильных ответов, на втором - меньшее, и т. д., до последнего, у которого имеется всего один правильный ответ.
В таблице 2 приводятся и основные статистические данные, которые принимаются во внимание на первом этапе эмпирической проверки качества заданий.
Вначале определяется мера трудности заданий. Известную трудность заданий, как первое требование к тестовым заданиям, можно образно сравнить с разновысокими барьерами на беговой дорожке стадиона, где каждый последующий барьер чуть выше предыдущего. Успешно преодолеть все барьеры сможет только тот, кто лучше подготовлен.
Трудность задания может определяться двояко:
1)умозрительно – то есть на основе предполагаемого числа и характера умственных операций, которые необходимы для успешного выполнения задания;
2)эмпирически - путем опробования задания, с подсчетом доли неправильных ответов по каждому из них.
Эмпирически трудность заданий можно определить, сложив элементы матрицы по столбцам, что укажет на число правильных ответов, полученных по каждому заданию (
Больше правильных ответов оказалось в первом задании (
В классической теории тестов многие годы рассматривались только эмпирические показатели трудности. В новых вариантах психологических и педагогических теорий тестов больше внимание стало уделяться ,помимо эмпирических показателей , характеру умственной деятельности учащихся в процессе выполнения тестовых заданий различных форм.
В силу простоты показатель
В результате получается нормированный (числом испытуемых) статистический показатель - доля правильных ответов,
Статистика
Поэтому в последние годы с показателем трудности заданий стали ассоциировать противоположную статистику - долю неправильных ответов (
Значения
Результаты сложения по строкам представлены в последнем столбце таблицы. Из последнего, одиннадцатого столбца таблицы видно, что больше правильных ответов у первого испытуемого, а меньше - у последнего. Это столбец представляет собой числовой вектор тестовых баллов испытуемых. Суммирование баллов всех испытуемых, представленных в таблице, дает число 65. Полезно посчитать средний арифметический тестовый балл в данной группе испытуемых
Это равенство отражает сумму всех элементов матрицы тестовых заданий, но только для случаев, когда для получения
3.4 Современный подход к понятию «трудность».
В современных технологиях адаптивного обучения и контроля используется другая мера трудности задания, равная
Логарифмические оценки таких, казалось бы, реально несопоставимых феноменов как уровень знаний каждого испытуемого, с уровнем трудности каждого задания, привели к незамысловатой, внешне, попытке сравнить их посредством вычитания. Однако эффективность такого сравнения оказала огромное влияние на развитие зарубежной педагогической теории и практики.
Впервые появилась возможность непосредственного сопоставления любого множества заданий с любым числом испытуемых. ЭВМ сопоставляет логит задания и логит знаний и на этой основе подбирает очередное задание в системах адаптивного обучения и контроля знаний.
Требование известной трудности оказывается важнейшим системообразующим признаком тестового задания. Если тест- это система заданий возрастающей трудности, то в нем нет места заданиям без известной меры трудности.
3.5 Вариация, дисперсия баллов и дифференцирующая способность.
Если на какое-то задание правильно отвечают все тестируемые, то такое задание становится не тестовым. Испытуемые отвечали на него одинаково; между ними нет вариации. Соответственно, по данному заданию в матрице будут стоять одни единички.
Не тестовым надо считать и то задание, на которое нет ни одного правильного ответа; в матрице по нему ставят, соответственно, одни нули. Вариация по нему также равна нулю. Нулевая вариация означает практическую необходимость удаления задания из проектируемого теста. Оно, для данной группы, не тестовое. Возможно, в другой группе это задание заработает, но это будет задание уже другого, а не данного теста, если под тестом понимать метод и результат измерения знаний.