Подкрепление и наказание (почти по Достоевскому) Стимулов написать эту маленькую статью у меня несколько. Главный из них, конечно же, лень . Зимы на Урале морозные. Занятия с ад-жилитистами на площадке часто приходится заменять теоретическими. А спорт-смены мало того, что болеют или домашним хозяйством занимаются, так еще и материал с разной скоростью усваивают. Кто-то сразу поймет, а другому нужно повторять и повторять. Изучение конспекта – способ малопродуктивный. Если че-ловек, ведущий конспект, материал не понимает, то и напишет в конспект не то, что говорит преподаватель, а то, что он сам ожидает услышать . А теперь – пусть статью читают! Хоть сто раз! И горло у педагога не заболит . Второй стимул – терминологическая разноголосица, которая царит в отечест-венной публицистике, затрагивающей тематику «бихейвористских» методов обу-чения. Третий стимул – автор на собственной шкуре почувствовал, что разобраться в этой терминологии непросто (если, конечно, не профессионал). Даже в автори-тетных книгах о кликер-тренинге (вроде фундаментального труда М.Спектора) иногда приводится два варианта терминологии. Назовем их условно «классиче-ский» и «бытовой». И попробуем разобраться в обеих. Любая терминология при-емлема – если четко определена! Еще несколько месяцев назад я считал, что для понимания процесса обучения достаточно «бытового» варианта. Я и сам им поль-зовался в статье об обучении шелти. Однако педагогическая практика заставила меня изменить точку зрения. Лучше потратить больше времени на разучивание базовых терминологических определений, но затем говорить на одном языке и иметь возможность корректно описать любое последствие поведения собаки. Итак, к делу! «Бытовой» вариант терминологии. Этот вариант рассматривает только три последствия поведения животного. 1. Происходит что-то приятное. 2. Ничего не происходит. 3. Происходит что-то неприятное. Если животное ведет себя желательным образом, то применяется положи-тельное подкрепление. Может и «ничего не происходить» - если применяется ва-риабельный режим подкрепления – но рассмотрение такого режима за рамками данной статьи. Здесь никакой терминологической путаницы не возникает. Все по-нимают, что положительное подкрепление – это «происходит что-то приятное» для собаки, что-то, к чему она стремится. И будет стараться повысить вероят-ность получения такого подкрепления. Оно может быть безусловным (подозвали – прибежала – получила кусок мяса). А может быть и условным (подозвали – при-бежала – условный сигнал - еда). Во втором случае возможны варианты: время подачи условного сигнала может быть разным. Например, когда начала бежать к хозяину. Или, наоборот, когда уже подбежала и села. Это зависит от того, какие цели преследует дрессировщик на данном этапе обучения. Общепринято, что, по-сле подачи условного сигнала, собака может прекратить поведение и бежать за своим безусловным кусочком (игрушкой). «Положительное подкрепление» полагается отличать от «поощрения». Обыч-но подчеркивают, что положительное подкрепление – воздействие очень точное по времени. Положительное подкрепление «отмечает» фрагмент желательного поведения собаки. Поощрение же – это что-то, повышающее собаке настроение, но не дающее конкретной информации о причинах радости хозяина. Потому что оно к времени не привязано. Собаку можно поощрить просто, чтоб подбодрить, до урока. Можно после. Кроме того, условное положительное подкрепление, как бы-ло сказано выше, позволяет собаке прекратить поведение. Что делает такой сиг-нал гораздо более значимым для собаки, чем поощрение. Ведь условный сигнал поощрения чаще всего дается в значении «молодец, продолжай дальше», что со-баке приятно, но откладывает реализацию ее гастрономических (или игровых) ам-биций на неопределенный срок. Т.е. положительное подкрепление является непо-средственным результатом того или иного поведения животного. А поощрение, строго говоря, таким следствием не является, а несет собаке лишь информацию о том, что дрессировщик рад тому, что «процесс пошел». Все, что пока написано, справедливо для обоих вариантов терминологии. А дальше начинается разнобой. Если животное ведет себя нежелательным образом, то возможны варианты. Либо нежелательное поведение игнорируется дрессировщиком – то есть, как следствие такого поведения «ничего не происходит». Либо вследствие нежелательного поведения «происходит что-то неприятное» для собаки. Вероятность такого происшествия в будущем собака постарается сни-зить. В большинстве статей отечественных авторов-практиков, а также в некото-рых зарубежных (иногда с предупреждением, что терминология – «бытовая») именно это неприятное событие называют отрицательным подкреплением. То есть в «бытовом» варианте терминологии собака стремится избежать отрица-тельного подкрепления. Позже мы убедимся, что в «классическом» варианте – все наоборот. Итак, в «бытовом варианте» (подозвали – не бежит – рывок поводком - побежа-ла), отрицательным подкреплением считают рывок. Отрицательное подкрепление также, как и положительное, может быть безусловным или условным. Цель вве-дения условного сигнала понятна – дать собаке информацию о точном времени совершения ошибки. По аналогии с парой «положительное подкрепление – поощрение», рассматри-вают пару «отрицательное подкрепление – наказание». Наказание отличается «размытостью» во времени и «неотвратимостью». То есть собака может благода-ря изменению поведения избавиться от отрицательного подкрепления, а вот на-казания ей никак не избежать. В том же примере с подзывом собаки можно прекратить рывки, как только соба-ка двинется в нужном направлении (и собака будет знать, что движение в направ-лении дрессировщика поможет ей избежать рывка или, в данной терминологии, отрицательного подкрепления). А можно поводком подтащить собаку к себе и наказать за «непослушание». Да-же, если наказание будет только словесным, последствия такого горе-обучения могут быть тяжелыми, процесс может развиваться лавинообразно . Подчеркну, что термин «наказание» также имеет разный смысл в «упрощен-ном» и «классическом» вариантах терминологии. «Классический» вариант терминологии. Такой вариант рассматривает все возможные последствия поведения животно-го. Всего их пять. 1. Начинается что-то приятное. 2. Заканчивается что-то приятное. 3. Начинается что-то неприятное. 4. Заканчивается что-то неприятное. 5. Ничего не происходит. Теперь определим две пары понятий. Первая: «положительно – отрицательное». Положительным назовем то, что начинается, независимо от того – прият-ное или неприятное это воздействие. Отрицательным назовем то, что заканчивается, независимо от того – при-ятное или неприятное это воздействие. Вторая: «подкрепление – наказание». Подкрепление – то событие, вероятность которого собака стремится увели-чить, которого старается достичь. Наказание – то событие, вероятность которого собака стремится уменьшить; которого старается избежать. Такая схема абсолютно логична, хотя ее запоминание и требует некоторого времени. Но, как только понятия «положительный» и «отрицательный» перестают ассоциироваться в сознании дрессировщика с понятиями «хороший» и «плохой», дело начинает двигаться вперед семимильными шагами . Тогда четыре из пяти вариантов последствий поведения собаки «обретают имена»: 1. Начинается что-то приятное = положительное подкрепление, П+ 2. Заканчивается что-то приятное = отрицательное наказание, Н- 3. Начинается что-то неприятное = положительное наказание, Н+ 4. Заканчивается что-то неприятное = отрицательное подкрепление, П- 5. Ничего не происходит. Тогда, в примере с подзывом на поводке, начало рывка – положительное нака-зание. Прекращение рывков – отрицательное подкрепление. Подчеркну, что значение слова «наказание» - абсолютно отлично от описанного в предыдущей главе. Для «старого» наказания нужен новый термин, например, «возмездие» . Ну, а пара «Положительное подкрепление – поощрение» остается без измене-ний. При занятиях «самоподкрепляющими» видами деятельности такими, как за-держание или преодоление препятствий, эффективно может применяться отрица-тельное наказание. Иногда в случае ошибки достаточно прекратить выполнение любимого собакой упражнения. И в следующий раз собака постарается избежать ошибок . В своей работе я обуславливал четыре из пяти вариантов последствий поведе-ния – чтобы четко указывать собакам момент удачи или ошибки. Например: П+ = клик, Н- = «Нельзя», Н+= «Фу», Ничего не происходит = «Нет». Надеюсь, что эта статья поможет нам с вами одинаково понимать терминоло-гию, встречающуюся в литературе. Если же Вы обнаружите в «бихейвористской литературе» знакомые термины в каком-либо значении, не рассмотренном в этой статье, пожалуйста, дайте мне знать. Страсть коллекционера проснулась….
|