Смекни!
smekni.com

Н. Смита рекомендована слушателям и преподавателям факультетов психологии и философии вузов по курсам общей психологии и истории психологии, системных методов ис­следования и преподавания психологии (стр. 79 из 168)

Каждый из четырех режимов подкрепления вызы­вает определенные, соответствующие ему паттерны поведения (Ferster & Skinner, 1957). Эти четыре ре­жима носят названия: (а) режим с фиксированной пропорцией, (б) режим с фиксированным интерва­лом, (в) режим с изменяющейся пропорцией и (г) режим с изменяющимся интервалом.

При режиме подкрепления с фиксированной про­порцией животное получает порцию пищи после каж-

дого фиксированного количества реакций. Если оно получает пищу после каждой реакции, данная разно­видность этого режима называется «постоянным подкреплением». Если постоянное подкрепление прекращается, животное скоро перестает реагиро­вать — происходит угашение реакции. Если пропор­ция отличается от значения, равного один к одному, и составляет, например, один к двадцати, темп реа­гирования между подкреплениями очень велик и за­тухание после прекращения подкрепления наступа­ет значительно медленнее. Таким образом, при силь­ном подкреплении реакции угашаются быстрее, чем при слабом подкреплении. Данный феномен получил название парадокса Хамфри в честь Ллойда Дж. Хам­фри (Lloyd G. Humphrey), впервые эксперименталь­но продемонстрировавшего его (Rachlin, 1991a).

При режиме подкрепления с фиксированным ин­тервалом животное получает подкрепление сразу после первой реакции, а затем через определенные периоды времени. Например, если интервал состав­ляет две минуты, голубь получает пищу через две минуты после того, как в первый раз клюнет диск. После того как голубь научится приблизительно оп­ределять временной интервал, он начинает клевать медленно почти до момента следующего подкрепле­ния, а затем начинает клевать очень быстро. Анало­гично многие студенты уделяют мало времени учебе почти до самого наступления экзаменов. Затем — за день или два, а то и в последнюю ночь перед экзаме­ном они начинают усиленно заниматься, заканчивая готовиться к экзамену глубоко за полночь. После сдачи экзамена они снова возвращаются к паттерну обучения кое-как до следующего экзамена. В этом отношении студенты, пожалуй, мало чем отличают­ся от голубей. Но как мы оценим поведение тех, чей график занятий отличается большей равномернос­тью и регулярностью? С точки зрения специалиста по анализу поведения, это означает, что такой режим работы также должен иметь подкрепление — воз­можно, в виде похвалы со стороны родителей; или же он подкрепляется успехами в учебе, являющимися следствием более рационального и эффективного метода обучения. Следовательно, эти студенты реа­гируют не только на фиксированный интервал.

Если подкрепление соответствует режиму с изме­няющейся пропорцией или с изменяющимся интер­валом, оно называется нерегулярным или «преры­вистым» («intermittent») подкреплением. При та­ком режиме животное сохраняет относительно равномерный темп реагирования, а угашение реак­ции после прекращения подкрепления происходит наиболее медленно по сравнению с остальными ре­жимами. Голубь, например, может продолжать кле­вать в течение часа или более после последнего под­крепления, и даже в этом случае — если на следую­щий день он окажется в той же ситуации — он снова начнет клевать с большой частотой. Вследствие не­регулярного характера подкрепления животному трудно определить, что подкрепление было прекра-

168

щено, поэтому реакция угашается медленно. Други­ми словами, сам по себе режим подкрепления в зна­чительной степени напоминает условия угашения реакции, поэтому животному трудно определить различие между условиями угашения и условиями подкрепления.

Классическим примером режима подкрепления с изменяющейся пропорцией являются азартные игры. Игрок никогда не знает, сколько раз он должен бро­сить кости или нажать на рычаг игрального автома­та, чтобы выиграть, и этот случайный выигрыш, как правило, меньший по размерам, чем сумма, затрачи­ваемая на игру, стимулирует продолжение игры. Множество форм человеческой деятельности выпол­няется под влиянием прерывистого подкрепления. Возможно, писателю удается найти издателя лишь для незначительной части своих произведений, одна­ко он продолжает работать, благодаря пусть и нере­гулярному заработку. Нумизмат перебирает тысячи монет и продолжает свои поиски, получая редкие подкрепления в тех случаях, когда ему удается най­ти монету, подходящую для его коллекции. Спорт­смен продолжает тренироваться благодаря наблюде­нию признаков своего прогресса и периодическим победам на соревнованиях. Истерики ребенка под­крепляются, когда родители уступают, а переменная частота подкреплений препятствует затуханию исте­рических реакций. Аналогично собака, выпрашива­ющая пищу с обеденного стола и в конце концов по­лучающая кусок, начинает просить подачку при лю­бой возможности.

В течение многих лет специалисты по анализу по­ведения исследовали различные режимы подкрепле­ния. Ни один из паттернов реакций, описанных ниже, не может быть вызван посредством применения на­казаний. Только благодаря положительному под­креплению удается сформировать устойчивые пат­терны реакций. Несмотря на это, большинство попы­ток использования обществом правовых систем в целях социального регулирования основаны на ис­пользовании наказаний, таких как штрафы и тюрем­ное заключение. Последствия применения наказаний весьма неоднозначны, однако в целом они отличают­ся значительно меньшей стабильностью в подавле­нии тех поведенческих реакций, формированию ко­торых способствуют положительные формы под­крепления. Например, уровень рецидивизма среди заключенных свидетельствует о том, что тюремное заключение малоэффективно с точки зрения искоре­нения преступности. Применение наказаний имеет и нежелательные последствия: наказания являются формой агрессии, которая вызывает ответную агрес­сию; они порождают страх и отвращение к видам де­ятельности, связанным с наказаниями; при этом лю­дям не предлагается никаких конструктивных аль­тернатив, показывающих, как им следует поступать.

Большинство профессиональных психологичес­ких организаций, таких как Американская психоло-

гическая ассоциация, требуют от своих членов еже­месячной уплаты взносов до определенного числа с целью избежать задержек платежей. Иными слова­ми, эти организации подчеркивают потенциальное наказание, ожидающее членов, не уплативших взно­сы вовремя. Однако в Ассоциации анализа поведе­ния (Association of Behavior Analysis) заведен дру­гой порядок: если член платит ранее определенного срока, размеры платы снижаются. Как кто-то сарка­стически заметил, анализ поведения сам по себе представляет пример положительного подкрепле­ния.

Результаты исследований, проводимых на живот­ных, показывают, что простая S —» R-модель класси­ческого бихевиоризма не объясняет феномена опе­рантного обусловливания, поскольку последствия экспериментальных действий являются частью само­го поведения, и потому должны быть включены в модель. Решение этой проблемы символически изоб­ражается в виде трехчленной ассоциации (three-term contingency):


(Эта структурная модель также известна в более общей форме как предшествующий стимул, поведе­ние и последствия.) Голубь различает звук колоколь­чика (SDistrim), клюет диск и получает подкрепление в виде пищи (SReinf). Все, что символизирует положи­тельную связь между подкреплением и реакцией, яв­ляется сигнальным (дифференцировочным) стиму­лом. Например, каждая кнопка с цифрой в автома­тическом лифте является сигнальным стимулом для соответствующего этажа (SRcinf). Если мы нажимаем на кнопку с цифрой 4 (Roer), лифт доставит нас на четвертый этаж и мы получаем подкрепление, за­ставляющее нас нажимать на кнопку с цифрой 4 в следующий раз (если нам нужен тот же этаж). Од­нако если нам нужно попасть на первый этаж и мы нажимаем на кнопку с цифрой 1, а лифт доставляет нас в подвал, в следующий раз мы, вероятно, не бу­дем повторять ту же реакцию, а вместо этого попро­буем нажать на кнопку с цифрой 2. Если цифра 2 обеспечит нам подкрепление, мы, вероятно, повто­рим эту реакцию в будущем. Мы постоянно сталки­ваемся с сигнальными (дифференцировочными) сти­мулами, связанными с подкреплениями: заглавие книги на полке, указывающее на то, что это та самая книга, которую мы ищем, сигналы светофора, конт-

169

ролирующее наше поведение на перекрестке, стрел­ки часов, напоминающие нам, что пора отправлять­ся на встречу, пятно на костюме, говорящее нам, что костюм пора отдать в чистку, и тысячи других про­явлений, многие из которых, как отметил Скиннер (Skinner, 1953, р. 75), не всегда ясно осознаются нами.

Лишь немногие виды человеческой деятельности поддерживаются благодаря таким первичным под-крепителям (primary reinforcers), как пища, однако вторичные подкрепители (secondary reinforcers) иг­рают важную роль в нашей жизни. Вторичный под-крепитель — это стимул, появляющийся до первич­ного подкрепителя и первоначально не имеющий подкрепляющей силы, однако приобретающий ее после достаточного количества сочетаний с первич­ным подкрепителем. Мощным вторичным подкрепи-телем в нашей культуре являются деньги (фактичес­ки они являются «всеобщим вторичным подкрепите­лем», поскольку служат для подкрепления множества форм поведения). Монеты и банкноты сами по себе практически бесполезны, однако их можно обменять на пищу, жилье и все, что представ­ляет для человека ценность. Соответственно, люди работают, пускаются в махинации, воруют, занима­ются предпринимательством, играют в азартные игры, — и все ради этого вторичного подкрепителя. Иногда формируются целые цепочки вторичных подкрепителей. Человек может выполнять какую-либо работу за (а) обещание получить (б) чек, кото­рый можно обменять на (с) деньги, на которые мож­но купить продукт, который, в свою очередь, можно будет продать и получить прибыль в форме (г) дру­гого чека, который можно обменять на (д) деньги, на которые можно купить продукт потребления или услугу.