Кузнецова Е.В. Одним из наиболее эффективных средств контроля в обучении ИЯ считается тест. В зарубежной литературе по тестированию под педагогическим или психологическим тестом часто понимают процедуру, предназначенную для выявления конкретного образца поведения (в нашем случае – речевого), из которого можно сделать выводы об определенных характеристиках личности (Вопросы контроля обученности …, 2001).
Тест (от англ. test – испытание, исследование) – это система заданий, выполнение которых позволяет охарактеризовать уровень владения языком с помощью специальной шкалы результатов. Тесты также широко применяются для определения способностей, умственного развития и других характеристик личности (Щукин, 2004: 297).
Тесты являются составной частью тестирования – метода исследования, предусматривающего выполнение испытуемым специальных заданий. Такие задания носят название тестовые. Они предлагаются либо в открытой форме (испытуемый должен дополнить основной текст, чтобы получить истинное высказывание), либо в закрытой форме (испытуемый должен выбрать нужный ответ из нескольких вариантов, причем один из них правильный, а остальные – нет).
Основное различие между традиционными контрольными заданиями и тестовыми заданиями заключается в том, что последние всегда предполагают измерение с использованием специальной шкалы (матрицы). Поэтому оценка, выставляемая по итогам тестирования, отличается большей объективностью и независимостью от возможного субъективизма преподавателя. Стандартная форма заданий при этом обеспечивает оперативность в работе и легкость подсчета результатов.
Максимально повысить надежность измерения и валидность использования теста можно, если следовать трем основным этапам его создания: 1) дать ясное и недвусмысленные теоретические – научно-обоснованные определения умений, которые надо измерить; 2) точно установить условие и операции, которых следует придерживаться при проведении теста и наблюдении за его выполнением; 3) количественно определить результаты наблюдений, с тем, чтобы убедиться, что используемые измерительные шкалы обладают всеми необходимыми качествами (Вопросы контроля обученности …, 2001).В методической литературе и практике обучения языку получили распространение два вида тестов: нормативно-ориентированные и критериально-ориентированные.
Нормативно-ориентированный тест (norm-referencedtest) предназначен для сравнения учебных достижений отдельных испытуемых. Результаты тестирования выражаются в баллах, и, соответственно, учащиеся располагаются в зависимости от количества набранных баллов. Этот тест широко используется при распределении учащихся по учебным группам (в составе учебной группы) с учетом уровня языковой подготовки и способностей.
Критериально-ориентированный тест (criterion-referencedtest) используется для оценки степени владения испытуемым пройденным материалом. Он получил распространение в середине 1970-х гг. в качестве надежного источника профессиональной аттестации кадров и для определения уровня владения языком (Щукин, 2004: 298).
Для оценки умения говорить на английском языке предлагается комплект тестов, составные части которого были разработаны Р. Ладо в 50-х годах. В комплект входят три «языковых» теста (проверка восприятия на слух языковых единиц разного порядка, лексический и грамматический тесты) и один «речевой» (сочинение). Уязвимым в тестах, оценивающих объект контроля опосредованно, является отсутствие доказательств корреляции между контролируемым объектом и объектами, предлагаемыми в тестах. Некоторые тестологи предлагают ставить испытуемого в условия реальной речевой деятельности, при которой он слушает или читает конкретные тексты, звучащие или письменные. Однако такая процедура делает тест очень громоздким, что фактически лишает тестовую форму контроля её преимуществ по сравнению с другими, нетестовыми. Кроме того, крайне сложным, практически почти невозможным становится подбор равных по трудности текстов для нескольких вариантов одного и того же теста.
Указанный вид теста, наряду с «чисто языковыми» тестами, в настоящее время является наиболее популярным. Такую форму контролирующего теста, безусловно, значительно легче реализовать на практике, чем, очевидно, и объясняется его распространенность. Однако его адекватность, даже только в отношении рецептивных видов речевой деятельности, нельзя считать доказанной, что признают и сами его сторонники. Во-первых, высказываются сомнения относительно достоверности получаемых результатов о степени понимания текста или владения тем или иным умением: неясно, например, когда происходит понимание текста – в процессе слушания/чтения или же в тот момент, когда учащийся работает с заданием теста и сравнивает предлагаемые ему решения вопроса, т.е. выбирает одно из готовых решений. Во-вторых, пока еще отсутствует исчерпывающий список умений, необходимых для осуществления того или иного вида речевой деятельности. В-третьих, нерешенным остается вопрос, следует ли проверять все умения (хотя бы из числа установленных) или же можно ограничиться несколькими; если же можно ограничиться несколькими умениями, то какими. Последняя проблема тесно связана с вопросом о возможности компенсации одного умения другим, на который также пока еще нет ответа. Наконец, сомнению подвергается и сама посылка – судить о сформированности того или иного вида речевой деятельности на основании отдельных умений. Эти сомнения высказывали Н. Брукс и другие исследователи еще в 60-х годах.
Тестирование продуктивных видов речевой деятельности (говорение и письмо) с форматом типа «комментарий» или «эссе» по объективным причинам является менее надежным, чем тестирование рецептивных видов (слушание и чтение) с форматом типа «множественный выбор».
Тест тина «заполнение пропусков в связном тексте» (clozeprocedure) представляет собой более надежную процедуру по сравнению с форматом «исправление ошибок» (editingprocedure) (Huges, 1997). Одновременно исследования показывают низкую надежность такого привычного способа измерения учебных достижений, как перевод (Spolsky, 2000). Проблема заключается в том, что тестовые задания различаются между собой по степени надежности (Backman, 1996), хотя вся получаемая с помощью тестов информация aprior, считается надежной в равной степени.
Надежность языкового тестирования зависит не только от формата самого теста, но и от согласованных действии экзаменаторов, оценивающих результаты выполнение продуктивных тестовых заданий (говорение и письмо). Несмотря на предпринимаемые усилия, экзаменаторы нередко расходятся в своем мнении, что особенно нежелательно в ситуациях, определяющих жизненный выбор учащихся.
Среди многочисленных типов заданий, которые используются для составления тестов и контрольных работ, чаще всего встречаются следующие:
- перекрестный выбор (matching),
- альтернативный выбор (true-false, ets.),
- множественный выбор (multiplechoice),
- упорядочение (rearrangement),
- завершение/ окончание (completion),
- замена / подстановка (substitution),
- трансформация,
- ответ на вопрос,
- внутриязыковое перефразирование,
- межъязыковое перефразирование (перевод),
- клоуз-процедура (clozeprocedure) и т. д.
В процессе языкового тестирования осуществляется измерение как целостных, так и дискретных (выборочных) знаний учащихся в их эксплицитной (демонстрируемой) форме. Объект языкового тестирования состоит из нескольких «рубрик оценивания» (Moskal, 2000). Оценки по этим рубрикам выставляются в соответствии с разработанными параметрами и критериями. Данные параметры необходимы для того, чтобы согласованно выставлять оценки за выполненное устное задание с учетом, например, «грамматической правильности высказывания», «механической организованности высказывания» (уместного употребления вводных слов и проч.), «логической организованности высказывания», «убедительной аргументации высказывания», «оптимальной презентации высказывания» (темп, четкость и т.п.).
Если используются дискретные рубрики, тестовое задание (например, эссе аргументирующего тина) может быть оценено отдельно за убедительность аргументов и, отдельно, по другим параметрам. Приэтом каждая из рубрик оценивания может иметь свой «вес», придавая большую пли меньшую значимость каждому из оцениваемых параметров. Рубрики оценивания позволяют не только измерить педагогический результат по нужным параметрам, но также получить ценную информацию о качестве знаний учащихся и наметить пути его повышения (Мильруд, Матиенко, 2006: 12).
Языковое тестирование является процедурой педагогических измерений, которая не лишена характерных противоречий. В наиболее общем виде рассматриваемые противоречия сводятся к тому, что стремление повысить объективность педагогических измерений приводит к унификации процедуры языкового тестирования без учета индивидуальных познавательных стилей. Желание повысить валидность языковых тестов приводит к тому, что важная информация, получаемая в ходе тестирования, игнорируется, так как теряется определенность того, «что именно измеряет данный тест». Повышение надежности языковых тестов осуществляется через процедуру «модерации», исключая гибкий личностно-ориентированный подход к организации тестирования (Мильруд, Матиенко, 2006: 12).
Стандартизация языкового тестирования, продиктованная стремлением повысить валидность, надежность и объективность применяемых контрольно-измерительных инструментов (тестов), нередко выражается в сопротивлении попыткам внедрить в практику педагогических измерений альтернативное языковое тестирование, обеспечивающее право выбора формы экзамена, более полный учет индивидуальных особенностей учащихся и способное сообщить участникам ценную информацию, существенную для повышения учебных результатов. Наконец, существующая количественная парадигма языкового тестирования, то есть ориентация на количественную норму, даже если применяются качественные критерии (все переводится в баллы), создает ложное впечатление, что успех есть количественный показатель. При этом существенно снижается роль языкового теста как гуманистического инструмента педагогических измерений.