Wzmocnienie ujemne: jak zamienić obiekt?

18

Mój Beauce Shepherd ma teraz 9 miesięcy, uczęszczaliśmy na zajęcia z wychowania behawioralnego z osobistym trenerem i wszystko poszło bardzo dobrze. Zanim pies zrobił to, co chciał, a teraz po prostu słucha naprawdę dobrze!

Według sugestii trenera niektóre zachowania zostały wzmocnione pozytywnie, a niektóre negatywnie. Problem, który mamy teraz, dotyczy zachowań, które wzmocniliśmy negatywnie. Używamy metalowego pudełka, aby wydać dźwięk, pies go nienawidzi i jest posłuszny. Jest zawsze używany po „nie” jako druga sankcja. Wszystko działa idealnie, a teraz nie musimy już korzystać z pudełka, ponieważ zachowuje się poprawnie.

Problem polega na tym, że uważamy, że będziemy musieli wymienić pudełko na coś innego, ponieważ nauczył się teraz, że jeśli nie będziemy mieć pudełka, nie będzie żadnego dźwięku, więc angażuje się w niepożądane zachowanie. Zaczyna być problemem, ponieważ musimy teraz wszędzie nosić skrzynkę, ponieważ jeśli jej nie mamy, skorzysta z okazji.

Czy istnieje sposób, aby to naprawić, zastępując pudełko naszym ciałem lub czymś takim?

Uwaga: Został usunięty ze szpitala miesiąc temu i odwraca się od nas nieco mniej, ale nadal robi to, gdy nie mamy pod ręką pudełka.

Dziękuję Ci

dogs behavior training

— Salketer
źródło

1

Prawdopodobnie powinieneś zadać swojemu trenerowi to pytanie, ale kiedy negatywne wzmocnienie (metalowa skrzynia) zadziałało w celu ograniczenia jego niechcianego zachowania, czy nie powinieneś teraz zacząć wzmacniać dobrych zachowań? Na przykład, jeśli mój pies wciąż wchodził na kanapę, mógłbym (1) potrząsnąć metalowym pudełkiem, aby go zniechęcić, a następnie, gdy dowiedział się, że chodzenie na kanapie było niepożądane, (2) chwaliłbym i hojnie traktowałem za każdym razem, gdy on ułożony na podłodze w pobliżu kanapy lub podobnego.

— Steve D,

1

:) Uwielbiam, jak psy mogą nauczyć się tych rzeczy same, po pewnym spostrzeżeniu ... „bez pudełka, hej, mogę robić, co chcę!” :) :) :)

— woliveirajr 10.10.13

10

Kiedykolwiek dyskutujesz o warunkowaniu operanckim , pomaga mówić tym samym językiem:

Wzmocnienie: Działanie mające na celu zwiększenie częstotliwości zachowania
Kara: Działanie mające na celu zmniejszenie częstotliwości zachowań
Pozytywne: obecność bodźca
Negatywne: brak bodźca

Terminy te mogą tworzyć cztery różne kombinacje ( Uwaga: przykłady w nawiasach to przykłady, a nie porady!):

Pozytywne wzmocnienie: Przedstaw bodziec, aby zwiększyć częstotliwość zachowań (np. Dać ucztę, gdy pies siedzi na polecenie)
Wzmocnienie ujemne: usuń bodziec, aby zwiększyć częstotliwość zachowań (np. Listonosz odchodzi po szczekaniu psa)
Kara dodatnia: Podaj bodziec, aby zmniejszyć częstotliwość zachowań (np. Uderz psa, gdy zostanie oddany moczu na dywan)
Kara negatywna: usuń bodziec, aby zmniejszyć częstotliwość zachowań (np. Wyjdź z pokoju, gdy pies na ciebie skoczy)

W praktyce mogą się one zagmatwać. Na przykład hałasowanie za pomocą pudła jest bodźcem zaprojektowanym w celu zmniejszenia częstotliwości zachowania, więc technicznie jest to przykład kary dodatniej, ale jeśli zatrzymasz hałas, gdy pies wykona prawidłowe zachowanie, usuniesz również bodziec do zwiększyć częstotliwość prawidłowego zachowania, hej presto !, wzmocnienie ujemne.

Ale to zakłada, że Twój pies ma prawidłowe zachowanie. Nie określasz, jakie jest niepożądane zachowanie lub czy istnieje pożądane alternatywne zachowanie, które próbujesz wzmocnić. Jeśli wszystko, co robisz z hałasem, próbuje powstrzymać go przed zrobieniem czegoś, to zapewniasz karę zamiast negatywnego wzmocnienia.

W obu przypadkach częścią twojego problemu jest prawdopodobnie to, że używasz tylko podstawowych wzmocnień i karaczy, czyli takich, których pies nie musi się uczyć. Na przykład żywność jest podstawowym wzmacniaczem. Pies wie, że jedzenie jest dobre bez konieczności uczenia się. W związku z tym hałas jest podstawowym czynnikiem karającym, ponieważ pies nie słyszy go. Natomiast drugorzędne posiłki i kary to te, których nauczył się pies.

Klasycznym przykładem jest dzwon Pawłowa, który dzwonił za każdym razem, gdy dostarczał psu jedzenie. Poprzez konsekwentne łączenie pierwotnego wzmacniacza z bodźcem, bodziec może zacząć działać jako wtórny wzmacniacz. Oznacza to, że pies dowiaduje się, że dzwonek sygnalizuje nadejście jedzenia i odpowiednio zareaguje.

Wspominasz, że używasz słowa „nie” (miejmy nadzieję surowym głosem, psy są dość biegłe w rozpoznawaniu intonacji), kiedy mówisz swojemu psu wraz z hałasem. „Nie” powinno działać jako dodatkowy kara, podobnie jak pochwała może działać jako dodatkowy wzmacniacz. Ale prawdopodobnie nie udało ci się stopniowo wyeliminować rzeczywistego hałasu, zaczynając czasami mówić tylko „nie”, ale nie robić hałasu.

Problem polega na tym, że do tej pory twój pies zrozumiał, że „nie” bez pudełka oznacza, że nie ma podstawowego punishera, tzn. Że nie są ze sobą spokrewnieni, a zatem oszczędza się, gdy go nie ma.

Sugeruję, abyś otworzył nowe pytanie opisujące rzeczywiste zachowania, które chcesz zniechęcić, a my moglibyśmy lepiej pomóc ci znaleźć sposób wykorzystania całego spektrum warunków operanckich, aby twój pies dowiedział się, czego chcesz do zrobienia.

— ThomasH
źródło

5

@ThomasH jest doskonałą odpowiedzią i porusza kwestię używania wtórnych osób karających w bardzo precyzyjny sposób.

Właśnie dodam kilka uwag na temat dwóch aspektów problemu.

Karać niewłaściwe zachowanie a wzmocnić prawidłowe zachowanie

Nawet jeśli „teoria” działa tak samo po „stronie wzmacniacza” i „stronie kary”, a efekty mogą być równie skuteczne, nie powinniśmy zapominać, że tłumienie zachowania nie uczy psa, co robić, i koncentruje się głównie na „nie” część szkolenia prowadzi do mikrozarządzania : musisz stale uczyć psa, czego nie powinien robić. Nawet jeśli pies nauczy się, że nie powinien wykonywać X w danej sytuacji, nadal może wykonać Y, Z itp. Jeśli pozytywnie go nauczysz (wzmocnisz), aby robić W zamiast tego, prawdopodobnie zatrzyma to jakieś błędne koło i uszczęśliwić wszystkich.

Wzmocnienie / kara o zmiennej wysokości

@ThomasH wyjaśnił pojęcie wtórnego wzmacniacza lub kary.

Jednym z aspektów, o którym należy pamiętać, jest to, że w przeciwieństwie do pierwotnych wzmocnień / kar, drugorzędni muszą być nagradzani (w taki czy inny sposób) według zmiennego harmonogramu .

Jedzenie jest podstawowym wzmacniaczem. Za każdym razem, gdy pies dostaje kawałek jedzenia, jest wzmacniany.

Ale słowo kluczowe takie jak „tak” lub kliknięcie może stać się dodatkowym wzmacniaczem. Jest powiązany z kolejnym pierwotnym wzmacniaczem. Kluczową kwestią jest to, że działa, ponieważ pies nauczył się, że dodatkowy wzmacniacz jest nagradzany przez podstawowy wzmacniacz. Kiedy się tego dowiesz, link musi być utrzymany z rzeczywistymi nagrodami. Na początku (podczas treningu) nagroda przychodzi za każdym razem, a następnie może być nagradzana zmiennym harmonogramem. Zmienny harmonogram w rzeczywistości wzmacnia połączenie, ponieważ pies nie może przewidzieć, kiedy nadejdzie główna nagroda.

Zauważ, że zwykle stosuje się to do trzeciorzędnych wzmacniaczy: wskazówka „sit” jest w rzeczywistości wzmacniaczem, ponieważ może prowadzić do kolejnego wzmacniacza (na przykład kliknięcia), który następnie prowadzi do faktycznej nagrody.

Zwykle nigdy nie oddzielamy dodatkowego wzmacniacza (kliknięcia) od podstawowego wzmacniacza (na przykład nagrody za jedzenie). Dzięki temu połączenie między nimi jest wyjątkowo silne, a zmienna szybkość jest stosowana między cue (trzeciorzędowym wzmacniaczem) a kliknięciem.

Jednak w przypadku kar nie ma się rzeczywistej „kary trzeciorzędnej”, więc zmienna stawka „wzmocnienia” (w tym przypadku rozumiana jako kara) mieści się między karą wtórną („nie”) a karą rzeczywistą ( pudełko).

— Cedric H.
źródło