К вопросу о компьютерных программах учебного контроля знаний (стр. 1 из 5)

Б.Х.Кривицкий, Высшая школа факультета психологии Московского государственного университета им. М.В.Ломоносова

Вводные замечания

Вопросы компьютерного контроля представляют большой интерес для преподавателей вузов и создателей средств реализации такого контроля. Интерес в значительной мере побуждается настойчивым внедрением Единого государственного экзамена для выпускников средних школ и зачислением в вуз по результатам этого экзамена. Между тем, вопросы компьютерного контроля недостаточно широко освещены в теоретическом плане, и интерес к ним обычно реализуется в большинстве случаев путем создания очередной программы компьютерного контроля с заранее составленным набором контрольных заданий. Однако, в области компьютерного контроля еще не все так очевидно, как представляется с первого взгляда. Имеются некоторые важные вопросы, которые либо освещены в малодоступной литературе, либо проработаны недостаточно прозрачно. Цель настоящей статьи состоит в привлечении внимания вузовских преподавателей к компьютерному контролю и ознакомлению преподавателей с ключевыми проблемами в этой области.

Рассмотрены три подхода к организации компьютерного контроля: традиционный, основанный на модели Раша и предлагаемый с учетом трудности заданий и случайным выбором. Статья написана на весьма доступном математическом уровне, в расчете на преподавателей различных специальностей, в том числе гуманитарных дисциплин. Также приводятся основные требования, которые желательно предъявлять к компьютерным программам контроля с тем, чтобы обратить внимание разработчиков на дидактические проблемы, связанные с разработкой программ такого назначения.

Особенности и ограничения компьютерного контроля знаний

Известно, что у учебного контроля много педагогических функций. При рассмотрении компьютерных средств контроля имеется в виду только одна из них, а именно, – проверочная (контрольная). Целью контроля является при этом установление уровня знаний контролируемого лица, в упрощенном понимании – выставление отметки за знания. Более широкую оценку знаний с помощью компьютерного контроля произвести затруднительно в силу специфических ограничений, накладываемых компьютером на возможность создания ответа на поставленный вопрос. Речь в дальнейшем пойдет только об обычных системах контроля знаний, без анализа особенностей интеллектуальных программ контроля.

Создание ответа на поставленный в задании при проведении контроля вопрос в обычных системах невозможен путем анализа семантики ответа, выполненного в произвольной речевой форме. Обычные компьютерные программы контроля могут только сопоставлять введенный ответ с кодом, характеризующим правильный ответ. Результатом такого сопоставления является фиксация совпадения или несовпадения. В большинстве программ совпадению приписывают единицу (ответ правильный) или 0 (ответ неправильный) когда совпадения нет. Конечно, возможна также фиксация отказа от ответа. Однако этот отказ является неинформативным и, как правило, не используется.

Нетрудно представить себе, сколь велико и принципиально указанное ограничение. Интеллектуальные программы, в которых возможно реализовать выявление семантики ответа в настоящее время распространения не получили в силу сложности программ и других трудностей, часто принципиального характера.

Перечислю основные типы ответов, которые достаточно просто можно реализовать в рамках проверки кодированного ответа.

Выборочный ответ. Вопрос (задание) формулируется так, что на него можно привести набор вариантов ответов, каждый из которых обозначается кодом (цифрой, символом, набором символов, картинкой и т.п.). Среди предлагаемых вариантов ответов может быть один правильный, хотя бы один верный, несколько верных, причем требуется указать либо все верные, либо их нужное число. Иногда форму выбора ответа усложняют, предлагая контролируемому лицу составить некоторый набор из нескольких групп, в каждой из которых следует выбрать ту или иную компоненту из представленного в каждой группе набора. Программа сопоставляет введенный код с кодом, размещенным в памяти программы компьютера и фиксирует ответ в бинарной системе.

Числовой ответ. Требуется решить задачу или произвести некоторые действия, в результате которых должно получиться число. Компьютер производит сверку введенного числа с числом в памяти компьютера. При этом в ответе удерживается нужно число знаков.

Проверка простой формулы. Ответ требуется ввести в виде не очень сложной формулы, правильность которой можно сверить простым способом, например сопоставлением результатов вычислений по введенной и правильной формулам. Во введенную и првильную формулы программой проверки обычно подставляются случайные числа.

Проверка логической формулы. В ответ на поставленный вопрос вводится некоторая последовательность слов или выражений, проверку наличия или отсутствия которых можно произвести с помощью заранее введенной в программу логической формулы.

Проверка слова, последовательности слов или других символов, вводимых в ответ, сформулированный в виде открытого вопроса с пропуском этих слов, которые требуется ввести испытуемому.

Перечисленные возможности сильно ограничивают дидактические возможности проверки правильности ответа и существенно влияют не выбор тех видов учебной деятельности, в которых можно применять компьютерную форму проверки. Действительно, такого рода проверка допустима (и широко используется) при оперативном или текущем контроле, возможна – при рубежном контроле, а также применяется для предварительного в более значимых видах учебного контроля, например, итоговом. Очевидно, что эти ограничения в значительной мере уменьшают уверенность в том, что результаты контроля адекватно отражают действительные знания контролируемых, что очень важно при выпускном контроле или вступительных экзаменах в вуз. Именно различия в психической деятельности индивидуума при создании им ответа на поставленный вопрос или при выборе нужного ответа из множества предложенных вариантов, не позволяют сделать контролирующему лицу выводы о характерных особенностях мыслительной деятельности и степени сформированности знаний по учебной дисциплине у испытуемых. Недаром многие руководители ведущих вызов страны возражают против такого способа отбора абитуриентов в вузы. Не буду углубляться в обсуждение вопроса о значимости, достоинствах и недостатках Единого государственного экзамена, в котором предполагается широкое применения компьютерных программ проверки знаний. Это отдельный дискуссионный вопрос, который является актуальным и пока не имеет однозначного научно обоснованного ответа.

Подходы к составлению компьютерных программ контроля

Здесь будут рассмотрены особенности подходов к созданию набора контрольных заданий для организации компьютерного контроля знаний. Такие наборы часто именуются тестами (предметно-ориентированными тестами), хотя между набором заданий и тестом имеются существенные отличия. Вопрос о том, при выполнении каких условий набор можно считать тестом, широко обсуждался в журнале «Вопросы тестирования в образовании». В частности, сошлюсь на обстоятельную статью А.И.Самыловского [Самыловский А.И., 2001]. Замечу лишь, что набор заданий, претендующий на наименование теста, должен, по меньшей мере, удовлетворять требованиям валидности и надежности . Для проверки претензий набора заданий на тест, существенную роль играют статистические испытания. Но педагогические статистические испытания почти невозможно производить в однородных условиях. Это обусловлено не только неправомерностью повторных предъявлений одних и тех же заданий одному и тому же составу проверяемых, но и вообще теоретической невозможностью обеспечить статистическую устойчивость (повторяемость) педагогических экспериментов. Тем не менее, выводы и методы теории статистки можно использовать в педагогике. Сошлюсь здесь на известную книгу Дж.Гласса и Дж.Стэнли «Статистические метолы в педагогике и психологии» [Гласс Дж., Стэнли Дж., 1976].

Возможны несколько подходов к составлению наборов тестовых заданий, которые могут быть заложены в компьютерную программу. Рассмотрим два известных и один предлагаемый подходы.

А) Традиционный подход

Этот подход подробно описан в работах В.С.Аванесова [Аванесов В.С., 1989; Аванесов В.С., 1991] и книге Г.А.Атанова [Атанов Г.А., 2002] и И.Н.Пустынниковой [Пустынникова И.Н., 2001]. Для полноты представлений, кратко рассмотрю процедуру составления набора заданий без детального представления математических выкладок. При регистрации результатов выполнения каждого из набора заданий в дихотомической системе (успех – единица, неуспех – ноль) принципиальным является вопрос об одинаковой сложности (трудности) предъявляемых заданий, т.е. о составлении набора равнотрудных заданий. Только такой набор может правильно отражать результаты проверки испытуемых. С точки зрения статистики можно представить, что имеется однородная по трудности гипотетическая генеральная совокупность, из которой произведена невозвратная выборка, составляющая данный набор заданий. Поскольку никакой априорной уверенности в составленном так наборе заданий об однородности нет, нужно произвести некоторую селекцию заданий, исключив из набора те, которые имеют «выпадаюшую из ряда» трудность. Как это сделать? Для этого проводится эксперимент, состоящий из предъявления значительной группе учащихся достаточно большого набора заданий. Очень было бы хорошо, чтобы группа была однородна по подготовке. Поскольку такой уверенности также нет, хорошо бы произвести много повторных испытаний с различными группами. Однако, в традиционном подходе по понятным причинам ограничиваются одной группой. По результатам проверки составляется таблица, в которой имеется столбец списка участников, столбцы с перечнем номеров упражнений и результатами испытаний, т.е. нулями и единицами расставленным по строкам списка. Для удобства таблицу дополняют строкой суммарных отметок по столбцам (по каждому упражнению) и столбцом суммарных результатов по каждому испытуемому. Далее эта таблица подвергается «чистке»: из нее удаляются упражнения, «выпадающие» по трудности из ряда остальных. Первоначально производится простое сопоставление результатов для всех упражнений. Если для какого-либо упражнения ответы почти всех испытуемых были равными единице, т.е. результат явно превосходит результаты испытаний для остальных упражнений, значит это упражнение явно легче остальных, обладает малой селективностью и должно быть удалено из перечня. Аналогично, если суммарный результат испытаний некоторого упражнения близок к нулю (имеет малое значение), упражнение слишком трудное. Оно также не селективно, и его также следует удалить.После этого первоначального этапа производится дальнейшая «чистка» таблицы.