Респондентное поведение – это скиннеровская версия павловского, или классического обусловлевания. Он также называл его обусловливанием типа С, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет её. Однако Скинер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Напротив, он делал акцент на поведении, не связанном с какими-либо известными стимулами. Тип поведения, который предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скинер определил, как оперантное поведение. Он также назвал его обусловливание типа Р, чтобы подчеркнуть воздействие реакции на будущее поведение.
Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликах, игра на фортепиано, написание своего собственного имени – это образцы оперантной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скинер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.
Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления) обусловились. Сила позитивного подкрепляющего стимула, таким образом, определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.
И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается.
/Например, вы скоро перестанете улыбаться человеку, который в ответ на вашу улыбку всегда бросает на вас сердитый взгляд или вообще никогда не улыбается. Если человек постоянно угрюм, вы, вероятно, попытаетесь совсем избегать его./
Скинер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.
Для того, чтобы изучать оперантное поведение в лаборатории, Скинер придумал на первый взгляд простую процедуру, названную свободным оперантным методом. Полуголодную крысу поместили в пустую «свободно-оперантную камеру» (известную как «ящик Скинера», где был только рычаг и миска для еды. Сначала крыса демонстрировала множество оперантов: ходила, принюхивалась, почесывалась, чистила себя и мочилась. Такие реакции не вызывались никакими узнаваемыми стимулами; они были спонтанны. В конце концов, в ходе своей ознакомительной деятельности крыса нажимала на рычаг, тем самым получая шарик пищи, автоматически доставляемый в миску под рычагом. Так как реакция нажатия рычага первоначально имела низкую вероятность возникновения, ее следует считать чисто случайной по отношению к питанию; то есть мы не можем предсказать, когда крыса будет нажимать на рычаг, и не можем заставить ее делать это. Однако лишая ее пищи, скажем, на 24 часа, мы можем убедиться, что реакция нажима на рычаг приобретет, в конце концов, высокую вероятность в такой особой ситуации. Это делается при помощи метода, называющегося научение через кормушку, посредством которого экспериментатор дает шарик пищи каждый раз, когда крыса нажимает на рычаг. Потом можно увидеть, что крыса проводит все больше времени рядом с рычагом и миской для пищи, а через соответствующий промежуток времени она начнет нажимать на рычаг все быстрее и быстрее. Таким образом, нажатие рычага постепенно становится наиболее частой реакцией крысы на условие пищевой дипревации. В ситуации оперантного научения поведение крысы является инструментальным, то есть оно действует на окружающую среду, порождая подкрепление (пищу). Если далее идут неподкрепляемые опыты, то есть если пища не появляется постоянно вслед за реакцией нажатия рычага, крыса, в конце концов, перестанет нажимать его, и произойдет экспериментальное угасание.
Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение, не подкрепленное или наказуемое, имеет тенденцию не повторяться или подавляться. Следовательно, концепция подкрепления играет ключевую роль в теории Скиннера.
Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления – правило, устанавливающее вероятность, с которой подкрепление будет происходить. Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию. В большинстве ситуаций повседневной жизни, однако, это либо не осуществимо, либо не экономично для сохранения желаемой реакции, так как подкрепление поведения бывает не всегда одинаковым и регулярным. В большинстве случаев социальное поведение человека подкрепляется только иногда.
/Ребенок плачет неоднократно, прежде чем добьется внимания матери. Ученный много раз ошибается, прежде чем приходит к правильному решению данной проблемы./ В обоих этих примерах, неподкрепленные реакции встречаются до тех пор, пока одна из них не будет подкреплена.
Скинер тщательно изучал, как режим прерывистого, или частичного, подкрепления влияет на оперантное поведение. Хотя возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя основными параметрами:
1. Подкрепление может иметь место только после того, как истек
определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления)
2. Подкрепление может иметь место только после того, как с
момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления).
В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления:
1. режим подкрепления с постоянным соотношением
2. режим подкрепления с постоянным интервалом
3. режим подкрепления с вариотивным соотношением
4. режим подкрепления с вариотивным интервалом
Теоретики, занимающиеся научением, признавали два типа подкрепления - первичное и вторичное. Первичное подкрепление – это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей – это пища, вода, физический комфорт и секс. Их ценностные значения для организма не зависит от научения. Вторичное или условное подкрепление, с другой стороны, - это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.
Небольшое изменение в стандартной процедуре опернтного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг « в ящике Скиннера» сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды. В этом случае звук действовал как различительный стимул, то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг не появляется ни пища, ни звуковой сигнал. Через какое то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым, ослабляя угасание. Другими словами установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула. Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами ранее имевшими подкрепляющие свойства.
Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного опернтного научения, особенно если это касается социального поведения человека. Иначе говоря если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразной.
Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги – особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое-либо из наших первичных влечений. Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения удовольствия. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинская помощь и образование. Иные виды генерализованных условных подкрепляющих стимулов – это лесть, похвала, привязанности и подчинение себе других. Эти так называемые социально подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Внимание – простой случай. Все знают, что ребенок может получить внимание, когда претворяется больным или плохо себя ведет. Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, подразнивают младших сестер или братьев и мочатся в постель – и все это для привлечения внимания. Внимание значимого другого – родителей, учителя, возлюбленного – особенно эффективны генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.