Четверг, 25.04.2024, 03:17
Приветствую Вас Гость
Главная | Регистрация | Вход
Архангельский областной кинологический центр

Главная » Статьи » Статьи по кинологии

ПОДКРЕПЛЕНИЕ И НАКАЗАНИЕ
Подкрепление и наказание (почти по Достоевскому)
Стимулов написать эту маленькую статью у меня несколько.
Главный из них, конечно же, лень . Зимы на Урале морозные. Занятия с ад-жилитистами на площадке часто приходится заменять теоретическими. А спорт-смены мало того, что болеют или домашним хозяйством занимаются, так еще и материал с разной скоростью усваивают. Кто-то сразу поймет, а другому нужно повторять и повторять. Изучение конспекта – способ малопродуктивный. Если че-ловек, ведущий конспект, материал не понимает, то и напишет в конспект не то, что говорит преподаватель, а то, что он сам ожидает услышать . А теперь – пусть статью читают! Хоть сто раз! И горло у педагога не заболит .
Второй стимул – терминологическая разноголосица, которая царит в отечест-венной публицистике, затрагивающей тематику «бихейвористских» методов обу-чения.
Третий стимул – автор на собственной шкуре почувствовал, что разобраться в этой терминологии непросто (если, конечно, не профессионал). Даже в автори-тетных книгах о кликер-тренинге (вроде фундаментального труда М.Спектора) иногда приводится два варианта терминологии. Назовем их условно «классиче-ский» и «бытовой». И попробуем разобраться в обеих. Любая терминология при-емлема – если четко определена! Еще несколько месяцев назад я считал, что для понимания процесса обучения достаточно «бытового» варианта. Я и сам им поль-зовался в статье об обучении шелти. Однако педагогическая практика заставила меня изменить точку зрения. Лучше потратить больше времени на разучивание базовых терминологических определений, но затем говорить на одном языке и иметь возможность корректно описать любое последствие поведения собаки. Итак, к делу!
«Бытовой» вариант терминологии.
Этот вариант рассматривает только три последствия поведения животного.
1. Происходит что-то приятное.
2. Ничего не происходит.
3. Происходит что-то неприятное.
Если животное ведет себя желательным образом, то применяется положи-тельное подкрепление. Может и «ничего не происходить» - если применяется ва-риабельный режим подкрепления – но рассмотрение такого режима за рамками данной статьи. Здесь никакой терминологической путаницы не возникает. Все по-нимают, что положительное подкрепление – это «происходит что-то приятное» для собаки, что-то, к чему она стремится. И будет стараться повысить вероят-ность получения такого подкрепления. Оно может быть безусловным (подозвали – прибежала – получила кусок мяса). А может быть и условным (подозвали – при-бежала – условный сигнал - еда). Во втором случае возможны варианты: время подачи условного сигнала может быть разным. Например, когда начала бежать к хозяину. Или, наоборот, когда уже подбежала и села. Это зависит от того, какие цели преследует дрессировщик на данном этапе обучения. Общепринято, что, по-сле подачи условного сигнала, собака может прекратить поведение и бежать за своим безусловным кусочком (игрушкой).
«Положительное подкрепление» полагается отличать от «поощрения». Обыч-но подчеркивают, что положительное подкрепление – воздействие очень точное по времени. Положительное подкрепление «отмечает» фрагмент желательного поведения собаки. Поощрение же – это что-то, повышающее собаке настроение, но не дающее конкретной информации о причинах радости хозяина. Потому что оно к времени не привязано. Собаку можно поощрить просто, чтоб подбодрить, до урока. Можно после. Кроме того, условное положительное подкрепление, как бы-ло сказано выше, позволяет собаке прекратить поведение. Что делает такой сиг-нал гораздо более значимым для собаки, чем поощрение. Ведь условный сигнал поощрения чаще всего дается в значении «молодец, продолжай дальше», что со-баке приятно, но откладывает реализацию ее гастрономических (или игровых) ам-биций на неопределенный срок. Т.е. положительное подкрепление является непо-средственным результатом того или иного поведения животного. А поощрение, строго говоря, таким следствием не является, а несет собаке лишь информацию о том, что дрессировщик рад тому, что «процесс пошел».
Все, что пока написано, справедливо для обоих вариантов терминологии. А дальше начинается разнобой.
Если животное ведет себя нежелательным образом, то возможны варианты.
Либо нежелательное поведение игнорируется дрессировщиком – то есть, как следствие такого поведения «ничего не происходит».
Либо вследствие нежелательного поведения «происходит что-то неприятное» для собаки. Вероятность такого происшествия в будущем собака постарается сни-зить. В большинстве статей отечественных авторов-практиков, а также в некото-рых зарубежных (иногда с предупреждением, что терминология – «бытовая») именно это неприятное событие называют отрицательным подкреплением. То есть в «бытовом» варианте терминологии собака стремится избежать отрица-тельного подкрепления. Позже мы убедимся, что в «классическом» варианте – все наоборот.
Итак, в «бытовом варианте» (подозвали – не бежит – рывок поводком - побежа-ла), отрицательным подкреплением считают рывок. Отрицательное подкрепление также, как и положительное, может быть безусловным или условным. Цель вве-дения условного сигнала понятна – дать собаке информацию о точном времени совершения ошибки.
По аналогии с парой «положительное подкрепление – поощрение», рассматри-вают пару «отрицательное подкрепление – наказание». Наказание отличается «размытостью» во времени и «неотвратимостью». То есть собака может благода-ря изменению поведения избавиться от отрицательного подкрепления, а вот на-казания ей никак не избежать.
В том же примере с подзывом собаки можно прекратить рывки, как только соба-ка двинется в нужном направлении (и собака будет знать, что движение в направ-лении дрессировщика поможет ей избежать рывка или, в данной терминологии, отрицательного подкрепления).
А можно поводком подтащить собаку к себе и наказать за «непослушание». Да-же, если наказание будет только словесным, последствия такого горе-обучения могут быть тяжелыми, процесс может развиваться лавинообразно .
Подчеркну, что термин «наказание» также имеет разный смысл в «упрощен-ном» и «классическом» вариантах терминологии.
«Классический» вариант терминологии.
Такой вариант рассматривает все возможные последствия поведения животно-го. Всего их пять.
1. Начинается что-то приятное.
2. Заканчивается что-то приятное.
3. Начинается что-то неприятное.
4. Заканчивается что-то неприятное.
5. Ничего не происходит.

Теперь определим две пары понятий.

Первая: «положительно – отрицательное».
Положительным назовем то, что начинается, независимо от того – прият-ное или неприятное это воздействие.
Отрицательным назовем то, что заканчивается, независимо от того – при-ятное или неприятное это воздействие.
Вторая: «подкрепление – наказание».
Подкрепление – то событие, вероятность которого собака стремится увели-чить, которого старается достичь.
Наказание – то событие, вероятность которого собака стремится уменьшить; которого старается избежать.
Такая схема абсолютно логична, хотя ее запоминание и требует некоторого времени. Но, как только понятия «положительный» и «отрицательный» перестают ассоциироваться в сознании дрессировщика с понятиями «хороший» и «плохой», дело начинает двигаться вперед семимильными шагами .
Тогда четыре из пяти вариантов последствий поведения собаки «обретают имена»:
1. Начинается что-то приятное = положительное подкрепление, П+
2. Заканчивается что-то приятное = отрицательное наказание, Н-
3. Начинается что-то неприятное = положительное наказание, Н+
4. Заканчивается что-то неприятное = отрицательное подкрепление, П-
5. Ничего не происходит.
Тогда, в примере с подзывом на поводке, начало рывка – положительное нака-зание. Прекращение рывков – отрицательное подкрепление.
Подчеркну, что значение слова «наказание» - абсолютно отлично от описанного в предыдущей главе. Для «старого» наказания нужен новый термин, например, «возмездие» .
Ну, а пара «Положительное подкрепление – поощрение» остается без измене-ний.
При занятиях «самоподкрепляющими» видами деятельности такими, как за-держание или преодоление препятствий, эффективно может применяться отрица-тельное наказание. Иногда в случае ошибки достаточно прекратить выполнение любимого собакой упражнения. И в следующий раз собака постарается избежать ошибок .
В своей работе я обуславливал четыре из пяти вариантов последствий поведе-ния – чтобы четко указывать собакам момент удачи или ошибки.
Например: П+ = клик, Н- = «Нельзя», Н+= «Фу», Ничего не происходит = «Нет».

Надеюсь, что эта статья поможет нам с вами одинаково понимать терминоло-гию, встречающуюся в литературе. Если же Вы обнаружите в «бихейвористской литературе» знакомые термины в каком-либо значении, не рассмотренном в этой статье, пожалуйста, дайте мне знать. Страсть коллекционера проснулась….

Категория: Статьи по кинологии | Добавил: Bagira (16.10.2008)
Просмотров: 817 | Комментарии: 2 | Рейтинг: 0.0/0 |
Всего комментариев: 2
2 Светлана  
0
Это статья известного в России тренера по аджилити Рудашевского М.А. из Перми, воспитавшего чемпионов России и мира

1 my--site  
0
Интересная статья. Главное - применить с умом.

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Соревнования

Расписание 2010

Расписание 2011

Форма входа
Полезности
Вставляем фото
Категории раздела
Статьи по кинологии [9]
Поиск
Мини-чат
200
Друзья сайта

  • Официальный блог

  • Смотреть фильмы онлайн

  • FAQ по системе

  • Инструкции для uCoz


  • Сайт о собаках и людях
  • Статистика

    Онлайн всего: 1
    Гостей: 1
    Пользователей: 0
    Copyright MyCorp © 2024Сделать бесплатный сайт с uCoz