Каждый из четырех режимов подкрепления вызывает определенные, соответствующие ему паттерны поведения (Ferster & Skinner, 1957). Эти четыре режима носят названия: (а) режим с фиксированной пропорцией, (б) режим с фиксированным интервалом, (в) режим с изменяющейся пропорцией и (г) режим с изменяющимся интервалом.
При режиме подкрепления с фиксированной пропорцией животное получает порцию пищи после каж-
дого фиксированного количества реакций. Если оно получает пищу после каждой реакции, данная разновидность этого режима называется «постоянным подкреплением». Если постоянное подкрепление прекращается, животное скоро перестает реагировать — происходит угашение реакции. Если пропорция отличается от значения, равного один к одному, и составляет, например, один к двадцати, темп реагирования между подкреплениями очень велик и затухание после прекращения подкрепления наступает значительно медленнее. Таким образом, при сильном подкреплении реакции угашаются быстрее, чем при слабом подкреплении. Данный феномен получил название парадокса Хамфри в честь Ллойда Дж. Хамфри (Lloyd G. Humphrey), впервые экспериментально продемонстрировавшего его (Rachlin, 1991a).
При режиме подкрепления с фиксированным интервалом животное получает подкрепление сразу после первой реакции, а затем через определенные периоды времени. Например, если интервал составляет две минуты, голубь получает пищу через две минуты после того, как в первый раз клюнет диск. После того как голубь научится приблизительно определять временной интервал, он начинает клевать медленно почти до момента следующего подкрепления, а затем начинает клевать очень быстро. Аналогично многие студенты уделяют мало времени учебе почти до самого наступления экзаменов. Затем — за день или два, а то и в последнюю ночь перед экзаменом они начинают усиленно заниматься, заканчивая готовиться к экзамену глубоко за полночь. После сдачи экзамена они снова возвращаются к паттерну обучения кое-как до следующего экзамена. В этом отношении студенты, пожалуй, мало чем отличаются от голубей. Но как мы оценим поведение тех, чей график занятий отличается большей равномерностью и регулярностью? С точки зрения специалиста по анализу поведения, это означает, что такой режим работы также должен иметь подкрепление — возможно, в виде похвалы со стороны родителей; или же он подкрепляется успехами в учебе, являющимися следствием более рационального и эффективного метода обучения. Следовательно, эти студенты реагируют не только на фиксированный интервал.
Если подкрепление соответствует режиму с изменяющейся пропорцией или с изменяющимся интервалом, оно называется нерегулярным или «прерывистым» («intermittent») подкреплением. При таком режиме животное сохраняет относительно равномерный темп реагирования, а угашение реакции после прекращения подкрепления происходит наиболее медленно по сравнению с остальными режимами. Голубь, например, может продолжать клевать в течение часа или более после последнего подкрепления, и даже в этом случае — если на следующий день он окажется в той же ситуации — он снова начнет клевать с большой частотой. Вследствие нерегулярного характера подкрепления животному трудно определить, что подкрепление было прекра-
168
щено, поэтому реакция угашается медленно. Другими словами, сам по себе режим подкрепления в значительной степени напоминает условия угашения реакции, поэтому животному трудно определить различие между условиями угашения и условиями подкрепления.
Классическим примером режима подкрепления с изменяющейся пропорцией являются азартные игры. Игрок никогда не знает, сколько раз он должен бросить кости или нажать на рычаг игрального автомата, чтобы выиграть, и этот случайный выигрыш, как правило, меньший по размерам, чем сумма, затрачиваемая на игру, стимулирует продолжение игры. Множество форм человеческой деятельности выполняется под влиянием прерывистого подкрепления. Возможно, писателю удается найти издателя лишь для незначительной части своих произведений, однако он продолжает работать, благодаря пусть и нерегулярному заработку. Нумизмат перебирает тысячи монет и продолжает свои поиски, получая редкие подкрепления в тех случаях, когда ему удается найти монету, подходящую для его коллекции. Спортсмен продолжает тренироваться благодаря наблюдению признаков своего прогресса и периодическим победам на соревнованиях. Истерики ребенка подкрепляются, когда родители уступают, а переменная частота подкреплений препятствует затуханию истерических реакций. Аналогично собака, выпрашивающая пищу с обеденного стола и в конце концов получающая кусок, начинает просить подачку при любой возможности.
В течение многих лет специалисты по анализу поведения исследовали различные режимы подкрепления. Ни один из паттернов реакций, описанных ниже, не может быть вызван посредством применения наказаний. Только благодаря положительному подкреплению удается сформировать устойчивые паттерны реакций. Несмотря на это, большинство попыток использования обществом правовых систем в целях социального регулирования основаны на использовании наказаний, таких как штрафы и тюремное заключение. Последствия применения наказаний весьма неоднозначны, однако в целом они отличаются значительно меньшей стабильностью в подавлении тех поведенческих реакций, формированию которых способствуют положительные формы подкрепления. Например, уровень рецидивизма среди заключенных свидетельствует о том, что тюремное заключение малоэффективно с точки зрения искоренения преступности. Применение наказаний имеет и нежелательные последствия: наказания являются формой агрессии, которая вызывает ответную агрессию; они порождают страх и отвращение к видам деятельности, связанным с наказаниями; при этом людям не предлагается никаких конструктивных альтернатив, показывающих, как им следует поступать.
Большинство профессиональных психологических организаций, таких как Американская психоло-
гическая ассоциация, требуют от своих членов ежемесячной уплаты взносов до определенного числа с целью избежать задержек платежей. Иными словами, эти организации подчеркивают потенциальное наказание, ожидающее членов, не уплативших взносы вовремя. Однако в Ассоциации анализа поведения (Association of Behavior Analysis) заведен другой порядок: если член платит ранее определенного срока, размеры платы снижаются. Как кто-то саркастически заметил, анализ поведения сам по себе представляет пример положительного подкрепления.
Результаты исследований, проводимых на животных, показывают, что простая S —» R-модель классического бихевиоризма не объясняет феномена оперантного обусловливания, поскольку последствия экспериментальных действий являются частью самого поведения, и потому должны быть включены в модель. Решение этой проблемы символически изображается в виде трехчленной ассоциации (three-term contingency):
(Эта структурная модель также известна в более общей форме как предшествующий стимул, поведение и последствия.) Голубь различает звук колокольчика (SDistrim), клюет диск и получает подкрепление в виде пищи (SReinf). Все, что символизирует положительную связь между подкреплением и реакцией, является сигнальным (дифференцировочным) стимулом. Например, каждая кнопка с цифрой в автоматическом лифте является сигнальным стимулом для соответствующего этажа (SRcinf). Если мы нажимаем на кнопку с цифрой 4 (Roer), лифт доставит нас на четвертый этаж и мы получаем подкрепление, заставляющее нас нажимать на кнопку с цифрой 4 в следующий раз (если нам нужен тот же этаж). Однако если нам нужно попасть на первый этаж и мы нажимаем на кнопку с цифрой 1, а лифт доставляет нас в подвал, в следующий раз мы, вероятно, не будем повторять ту же реакцию, а вместо этого попробуем нажать на кнопку с цифрой 2. Если цифра 2 обеспечит нам подкрепление, мы, вероятно, повторим эту реакцию в будущем. Мы постоянно сталкиваемся с сигнальными (дифференцировочными) стимулами, связанными с подкреплениями: заглавие книги на полке, указывающее на то, что это та самая книга, которую мы ищем, сигналы светофора, конт-
169
ролирующее наше поведение на перекрестке, стрелки часов, напоминающие нам, что пора отправляться на встречу, пятно на костюме, говорящее нам, что костюм пора отдать в чистку, и тысячи других проявлений, многие из которых, как отметил Скиннер (Skinner, 1953, р. 75), не всегда ясно осознаются нами.
Лишь немногие виды человеческой деятельности поддерживаются благодаря таким первичным под-крепителям (primary reinforcers), как пища, однако вторичные подкрепители (secondary reinforcers) играют важную роль в нашей жизни. Вторичный под-крепитель — это стимул, появляющийся до первичного подкрепителя и первоначально не имеющий подкрепляющей силы, однако приобретающий ее после достаточного количества сочетаний с первичным подкрепителем. Мощным вторичным подкрепи-телем в нашей культуре являются деньги (фактически они являются «всеобщим вторичным подкрепителем», поскольку служат для подкрепления множества форм поведения). Монеты и банкноты сами по себе практически бесполезны, однако их можно обменять на пищу, жилье и все, что представляет для человека ценность. Соответственно, люди работают, пускаются в махинации, воруют, занимаются предпринимательством, играют в азартные игры, — и все ради этого вторичного подкрепителя. Иногда формируются целые цепочки вторичных подкрепителей. Человек может выполнять какую-либо работу за (а) обещание получить (б) чек, который можно обменять на (с) деньги, на которые можно купить продукт, который, в свою очередь, можно будет продать и получить прибыль в форме (г) другого чека, который можно обменять на (д) деньги, на которые можно купить продукт потребления или услугу.