В контрольной группе подопытных крыс, где не применялись удары током, не наблюдались никакие систематические изменения.
Теперь рассмотрим данный эксперимент более подробно для выяснения интересующих нас вопросов.
В реальности имело место несколько типов научения:
1. Классическое обуславливание (по Павлову)
Условный стимул (УС), в нашем случае это зуммер, в сочетании с безусловным стимулом (БС) – удар током, вызывают поведенческий паттерн или безусловную реакцию - прыжок (БР).
После серий повторений пары УС-БС, условный стимул без сочетания с БС вызывает условную реакцию, сходную с БР.
УС БРБС
В рассматриваемом нами эксперименте, Доллард и Миллер описывают происходящий процесс:
БС remot Sd(драйв) RemotУС звук
Из схемы видно, что сочетание БС-УС не вызывает БР, а только в результате драйва возникает нужная устойчивая БР или Remot.
Миллер постулирует, что любая внешняя или внутренняя стимуляция, будучи достаточно интенсивной, пробуждает драйв и побуждает действие. В нашем случае сила усвоенной реакции зависит от силы тока.
Драйв в теории научения –мотивационный концепт в системе, он побуждает или активирует, но не определяет направление. Существуют различные драйвы. В эксперименте – это боль, врожденный и первичный.
В системе Холла, из которой исходили Доллард и Миллер, имеющее место научение описывается как ассоциативная связь между УС и remot, что представляет собой теоретический концепт – навык. Холл постулировал, что для того чтобы навык сформировался, нужно не только чтобы стимул и реакция были во времени и пространстве, но и то, чтобы реакция сопровождалась подкреплением или наградой.
А теперь вернемся к эксперименту. Удар током и звук симулируют множество внутренних энергичных реакций, но лишь одна – перепрыгивание через барьер – имеет подкрепление, прекращение ударов тока, поэтому она и усиливается. Этим отличается пример научения в данном эксперименте от классического обуславливания, - появление подкрепления зависит от реакции; реакция продуцирует подкрепление.
Но обратим внимание на одну деталь. Во второй сессии, когда был изъят первичный драйв (удар током) должно было наблюдаться угасание выработанной реакции. Но этого не происходит, а реакция даже усиливается. Почему? Доллард и Миллер полагают, что «подкрепление» продолжается. Но где? Условный стимул вызывает не боль, а усвоенную реакцию страха, которая активизирует боязнь драйва и продуцирует инструментальную реакцию.
Таким образом, как классически обусловленная реакция страха, так и инструментальная получают подкрепление.
Однако экспериментальное угасание появляется в третьей части эксперимента, когда прыжок становится не эффективным в плане отключения звука и вызванного им страха. Вместо этого крыса усваивала новую реакцию нажатия на рычаг. Она научалась новой реакции, мотивированная усвоенным драйвом страха и подкрепляемая редукцией этого страха.
Итак, мы наконец подошли к понятию процесса научения. Из всего выше сказанного следует, что существует четыре концептуально важных элементов научения: драйв, ключевой раздражитель, реакция и подкрепление.
Ключ – это стимул, руководящий реакцией организма, определяя точную природу этой реакции. «Ключ определяет, когда возникнет реакция, куда она будет направлена и какова она будет»(Dollard&Miller/1950). Чем более стимул внутренний или внешний сходен с ключом, тем в большей степени возможна именно эта реакция.
Важным фактором также является реакция. Критическим этапом научения является продуцирование соответствующей реакции. Более подробно об этом рассказано будет позже.
Но главным в процессе научения является подкрепление. Рассмотрим еще раз его структуру.
При предъявлении ситуации, если она представлена впервые, то возникает первичная иерархия реакций. Затем в результате поведения, некоторые из реакций получают подкрепление, т.е. редукцию какого либо драйва. В результате возникает результирующая иерархия, проще говоря, происходит научение.
Подкрепление в таком контексте реакций, скорее всего вновь появятся при встрече с подобными ситуациями.
Но что произойдет, если ни одна реакция индивидуума не получит подкрепления? Эта ситуация приводит к угасанию неэффективного поведения и к более широкому адаптивному поведению. Эту дилемма научения вынуждает искать новые реакции или вызывают реакции, более отдаленные во врожденной иерархии, что и составляет трудность в научении новым реакциям.
Дрессировка.
Если при оперантном научениии животному дается максимальная возможность проявить инициативу, самостоятельно выбрать способ действия в решении задачи, то при дрессировке вырабатывается именно требуемый навык под целенаправленном воздействием.
Дрессировка осуществляется путем систематической тренировки животного, при которой подкрепляются требуемые двигательные реакции и их сочетания, и устраняются нежелательные. Желаемые реакции при дрессировке всегда выполняются в ответ на подаваемые сигналы человека.
Дрессировка является более сложным процессом, чем простое обуславливание или оперантное научение. Трудность заключается в объяснении задачи, требования к животному.
Дрессировка делится, по М.А.Герд, на три стадии:
· Наталкивание – задача впервые вызвать у животного нужную систему движений. Это осуществляется 3 способами: Непосредственной наталкивание – следование животного или поворачивание вслед за пищевыми или иными актуальными раздражителями. Косвенное наталкиванием провоцируются движения непосредственно не направленные на раздражитель, но обуславливаемые общим возбуждением. При сложном наталкивании дрессировщик вырабатывает у животного сначала определенный навык, а потом меняет ситуацию, заставляя животного применять выработанное умение.
· Стадия отработки – этап, при котором совершается от шлифовка первичной требуемой системы движений и выработка удобной сигнализации для дальнейшего управления животным. Также на этом этапе происходит замена пищевого награждения реакцией на подаваемый дрессировщиком сигнал.
· На стадии упрочнения усилия дрессировщика направлены на закрепление навыка и надежность его воспроизведения на сигнал дрессировщика.
Произведенный Гердом анализ дрессировки указывает на сложность, гетерогенность и многоплановость поведения животных при дрессировке. Но и при приобретении навыка животными в естественных условиях наблюдается такая же картина. Знание об этом является залогом успеха при исследовании познавательных процессов при формировании навыка.
Познавательные процессы при формировании навыка.
Практически сразу у ученых сложилось мнение, что формирование навыков происходит путем « проб и ошибок», т.е. в процессе научения животное закрепляет « полезное» и отсеивает все остальное. Это хорошо представлено в экспериментах на лабораторными крысами Э. Толменом, Протопоповым, И.Ф. Дэншеллом.
Они предполагали, а позже и доказали, что движения, производимые животными для решения задач, не являются хаотичными, а формируются в процессе активной ориентировочной деятельности.
Рассмотрим это предположение на примере опытов, описанных Э.Толменом в статье « Когнитивные карты у крыс и у человека».
В этой статье Э.Толмен дает сравнение двум школам зоопсихологов, описывающих познавательные процессы при выработке навыка.
Первая школа зоопсихологов считает, что поведение крыс в лабиринте сводится к образованию простейших связей между стимулом и реакцией. Научение, по этой теории, состоит в относительном усилении одних и ослаблении других связей; те связи, которые приводят животное к верному результату, становятся относительно более открытыми для прохождения нервных импульсов, и, наоборот, те, которые ведут его в тупики, постепенно блокируются. Также нужно отметить, что эта школа подразделяется на две подгруппы: первая подгруппа утверждает, что простая механика, имеющая место при пробежке по лабиринту, состоит в том, что решающим стимулом от лабиринта становится стимул, наиболее часто совпадающий с правильным ответом, по сравнению со стимулом, который связан с неправильным ответом.
Вторая подгруппа исследователей внутри этой школы утверждает, что причина, почему соответствующие связи упрочиваются по сравнению с другими, состоит в том, что вслед за ответами, которые являются результатом правильных связей, следует редукция потребности. Таким образом, голодная крыса в лабиринте имеет тенденцию стремиться к получению пищи, и ее голод ослабляется скорее в результате верных ответов, а не в результате заходов в тупики.
Далее Толмен представляет вторую школу, к которой по его словам, он принадлежал сам. Представление о научении этой школой трактуется, как образование у крыс карты поля окружающей обстановки, так называемыми когнитивными картами.
Обратим внимание на эксперименты по латентному научению.
Наилучшим Толмен считает эксперимент, проведенный Спенсером и Липпитом в университете Иова. В ходе опыта использовался простой Y-образный лабиринт (рис. 1) с двумя целевыми ящиками. В правом конце лабиринта У помещали воду, в левом - пищу. Во время опыта крысы не были голодны и не испытывали жажды. Перед каждым из ежедневных опытов они были накормлены и напоены.