> Ze země > Klikr trénink: OPAKEM ODMĚNY není trest, ale ŽÁDNÁ ODMĚNA – 1. část

Klikr trénink: OPAKEM ODMĚNY není trest, ale ŽÁDNÁ ODMĚNA – 1. část

Učení
Trénink koní na jakékoli úrovni výcviku je ve své podstatě nekončící proces, ve kterém učíme koně novému chování, „vylepšujeme“ to, které už umí, nebo nahrazujeme to, které nám nevyhovuje. Mimo to, učení probíhá i v době, kdy netrénujeme. Učení je v podstatě jakákoli interakce s okolním prostředím.
Tyto interakce v podstatě neustále formují osobnost a chování jedince. Pro koně, stejně jako pro všechny živé tvory člověka nevyjímaje, platí, že se učí pomocí zkušeností, které získávají z těchto interakcí. Proto je nesmírně důležité alespoň částečně rozumět souvislostem.
Existuje celá řada typu učení, které je možné při tréninku koní využít. Běžně se setkáme s desenzitivizací (znecitlivění), habituací (navykání), senzomotorickým učením (smyslově pohybovým) a podmiňováním (pavlovovským či operantním). V tuto chvíli nás bude zajímat typ označovaný jako podmiňování.

Klasické podmiňování
Původní myšlenky pocházejí z výzkumů profesora I. P. Pavlova.
Klasické podmiňování jako proces učení přidává dříve neutrálnímu – bezvýznamnému podnětu význam, díky kterému se spustí chování, které dříve nemělo s tímto podnětem žádnou spojitost. Toho se dosáhne tím, že se mnohokrát společně vyskytne podnět a odměna.
Jako příklad se uvádí Pavlovův experiment, při kterém psi mnohokrát uslyšeli zvonek a dostali potravu. Přítomnost potravy spouští přirozeně reflex, při kterém se vylučují sliny. Psi při experimentu začali po zaslechnutí zvonku slinit, přestože už žádnou potravu nedostávali. Reakce (slinění) se stala podmíněným reflexem, objevujícím se „automaticky” po podmiňujícím podnětu (zvuku zvonku).
U koní se můžeme setkat s podmíněným reflexem na šustění pytlíku, nebo rachocení kyblíků s krmením. Dokud koně opakovaně nezažili, že tyto zvuky znamenají blížící se krmení, pravděpodobně jim nevěnovali žádnou pozornost a dál se věnovali svému. Podobně se koně naučí odhadovat dobu krmení. Nemusí nutně vnímat čas, ale mohou si všímat jiných okolností, které se těsně před krmením pravidelně opakují. Vymývání nádob, otvírání skladu s krmivem, charakteristické zvuky z přípravny.

Operantní podmiňování
Myšlenky E. Thorndikea, které dále rozvinul B. F. Skinner.
Řídíme a obměňujeme svoje chování na základě důsledků plynoucích z našeho chování.
Chování, které vedlo k dosažení úspěchu, se v dalším pokusu vyskytne pravděpodobněji než chování, které k úspěchu nevedlo.
Úspěšné chování přetrvává, neúspěšné naopak mizí. Úspěšné chování se stává prostředkem pro dosažení uspokojení.
Operantní podmiňování využívá toho, že každé i náhodné chování koně je reakcí na podnět. Přičemž existuje důvod, proč kůň reaguje na podněty, označujeme jej jako posílení. Jinak řečeno, chování se stává posíleným, jestliže důsledek tohoto chování motivuje koně k tomu, aby chování zopakoval. Pokud tato motivace chybí, chování se neopakuje.
Chceme-li, aby za námi kůň v ohradě přicházel, dáme mu, pokaždé když přijde, jablko, které miluje. Podnětem je má přítomnost v ohradě, chování je příchod koně, a důsledek jeho chování je získání jablka. Každým získaným jablkem je chování více posíleno. Čím častěji kůň získá tuto zkušenost, tím ochotněji k nám bude přicházet.
Trénink/učení je tedy proces založený na tom, že každé chování má jistý důsledek. A tento důsledek rozhoduje o tom, zda se kůň bude pokoušet chování opakovat nebo ne. Na první pohled se zdá všechno jednoduché. Pojďme se ale podívat na důsledky chování poněkud hlouběji.

Podnět – chování – důsledek
Jistě jste se už nejednou zamýšleli nad tím, jak toho dosáhnout, potřebujeme-li koně nějaké chování naučit, anebo naopak nějaké chování odnaučit. V té souvislosti jste si určitě vzpomněli na odměny a tresty.
V první řadě je důležité si uvědomit, že odměny a tresty v tréninku jsou součástí celku. Nefungují jen samy o sobě. Ten celek tvoří „podnět-chování-důsledek“.
podnět představuje příležitost použít chování
chování je reakce na podnět
důsledek je to, co následuje po chování a co přinese anebo nepřinese uspokojení – tedy odměna anebo trest
K tomu aby trest či odměna fungovaly, musí kůň rozumět, jakého chování se týkají.

Operantní podmiňování jako teorie o učení
Operantní podmiňování k vysvětlení vztahů a souvislostí mezi podnětem, chováním a důsledkem používá rozdělení na čtyři kvadranty.
V tento okamžik je potřeba zmínit, že v operantním podmiňování se používají slova pozitivní a negativní jiným způsobem než v běžné hovorové řeči. Zjednodušeně se dá říct, že vyjadřují přičítání a odečítání, jako zkratka se dokonce používá znaménko plus a mínus. Pozitivní znamená „něco přidávat“ a negativní znamená „něco ubírat“.
První dva kvadranty zabývající se posílením chování jsou totiž označované jako pozitivní a negativní posilování. Druhé dva jako pozitivní a negativní tresty.

Odměna a trest
Tyto dvě slova jsou na první pohled snadno pochopitelná a určitě jste si je již spojili s tím, co jste četli před chvílí. Nejspíše vyvolají určité představy, co by mohlo být odměnou a co naopak trestem.
Pojďme se na odměnu a trest podívat trošku jinak, ne jako na konkrétní situace, ale pouze jako na něco abstraktního. Zapomeňme vše, co jsme si o odměnách a trestech mysleli. Od této chvíle budou pro nás označovat důsledky chování, fungující takto:
Odměna – posílení je vše, co přinese koni uspokojení.
Trest je vše, co koni uspokojení nepřinese.

Pozitivní posilování
Jako důsledek chování koně přidáváme něco příjemného, žádoucího, co tím přinese koníkovi uspokojení. Zvyšuje se pravděpodobnost, že kůň bude své chování příště opakovat.
Pokud budeme pravidelně odměňovat koně poté, co za námi přijde k ohradě, pozitivně posílíme “přicházení” koně k nám. Pozitivně posíleno může být ale také vytržení otěží z rukou jezdce, ať už za účelem sklonit hlavu a napást se nebo třeba nacválat – pokud se koníkovi podaří.
Pro pozitivní posilování (positive reinforcement) používáme zkratku R+.

 

Negativní posilování
Jako důsledek chování koně odebíráme něco nepříjemného, nežádoucího pro trénovaného, a tím mu přinášíme uspokojení. Také zde se zvyšuje pravděpodobnost, že kůň bude své chování příště opakovat.
Klasickým příkladem negativního posílení je vykročení koně učené pomocí přiložení holeně, případně zesílené tušírkou, kdy holeň uvolníme v okamžiku, kdy kůň vykročí. Dalším příkladem je kůň, který se vykročením a následováním vodítka vyhýbá tahu na ohlávce, tím se u něj negativně posiluje následování vodítka.
Pro negativní posilování (negative reinforcement) se používá zkratka R-.

Pozitivní trest
Jako důsledek chování koně se přidáme něco nepříjemného a nežádoucího, tím znemožníme jeho uspokojení. Snižuje se pravděpodobnost, že chování bude kůň příště opakovat.
Obvykle pod pojmem trest vnímáme fyzické ublížení, např. zacukání za vodítko, otěže. Často ale bývají pozitivní tresty mnohem nenápadnější. Například jen hrozba korekce – zkušenost koně, že nesplní-li požadovaný úkol, může být potrestán fyzicky, způsobí, že i pouhý náznak pozvednutí jezdeckého bičíku zřejmě přeruší jeho chování.
Pro pozitivní tresty (positive punishment) používáme zkratku P+.

Negativní trest
Znamená, že jako důsledek chování koně se odebereme něco příjemného a pro koně žádoucího, tím se znemožní jeho uspokojení. Snižuje se pravděpodobnost, že kůň bude své chování opakovat i příště.
Odnaučit vzít si pamlsek dřív, než mu jej sami nabídneme, můžeme tím, že pokud se kůň pokusí si pamlsek z ruky sám vzít, ruku zavřeme, případně skryjeme za záda, čímž se pamlsek stane nedostupný, a to je onen negativní trest. Pokračovat bychom mohli tím, že jakmile se koník na okamžik přestane snažit dostat do ruky, jen trochu odkloní hlavu a povolí jeho zájem, ruku otevřeme a pamlsek mu nabídneme (a to už je pozitivní posílení toho, že se do ruky nedobývá).
Pro negativní tresty (negative punishment) používáme zkratku P-.

Klikr trénink
Chceme-li posílit určité chování, potřebujeme, aby odměnu kůň získal v okamžiku, kdy chování proběhlo, nebo velmi brzy po něm. Jen tehdy si kůň dokáže spojit získanou odměnu s chováním, které právě provedl. Ve většině situací je ale téměř nemožné dát odměnu okamžitě. Proto trenéři pozitivního posilování používají tzv. marker.
Marker
Pomocí markeru označujeme chování, které se nám líbí a které chceme odměnit. Marker zároveň vytváří bridge (= přemostění) mezi chováním a odměnou. Má za úkol označit okamžik, kdy probíhá chování, a tím spojit chování s okamžikem, kdy se nám podaří „doručit“ odměnu. Původní řetězec popisující tvorbu chování se rozšíří takto “podnět – chování – marker – důsledek”.
Většina trenérů k tomu používá pomůcku, které se říká klikr. Je to malá plastová krabička, která při stisknutí vydává zvuk – kliknutí.
Kůň brzy zjistí, že po kliknutí následuje odměna. Proto začne dávat opravdu dobrý pozor, aby přišel na to, kdy zazní tento zvuk. Následně začne opakovat chování, které markeru předcházelo, aby tím získal další kliknutí.
Například chceme-li naučit koně nedobývat se do naší zavřené dlaně s pamlskem, použijeme marker v okamžiku, kdy na moment odkloní hlavu od naší ruky, a odměníme. Koně mají rádi pocit, že jsou to oni, kdo kontroluje situaci. Že jsou to právě oni, kdo ovlivní, kdy získají odměnu. Odklonění hlavy od naší ruky je jeho volba chování, kterou nás “donutí” otevřít dlaň a dát mu odměnu.
Proč použít právě klikr?
Kliknutí je rychlé a velmi přesné. Není ovlivněno emocemi lidského hlasu. Zvíře nepotřebuje udržovat oční kontakt s trenérem. Nezáleží na tom, kdo klikr stiskne, zní to vždy stejně.
Často je využívaný i jiný zvukový marker – píšťalka, a ještě častěji nějaké slovo: ”Šikovná“, „Áno”, “Hodný!”. Výhody takového slovního markeru jsou zřejmé. Budeme jej mít vždy s sebou a umožní mít volné obě ruce, což oceníme například při jezdeckém tréninku. Vhodné je vybrat si pouze jedno slovo ve specifické intonaci, a to pak používat. Ideálně takové, které nepoužíváme v běžné řeči, například místo “Ano!”, anglické ”Yes!”.
Nicméně hlasový marker (slovo) má oproti klikru i nějaké nevýhody: má vždy malé zpoždění, obvykle dokážeme pohnout prstem rychleji, než dokážeme promluvit. Hlas se navíc liší v závislosti na okolnostech, může jej ovlivnit nemoc, nebo naše emoce, změní se tím naše intonace. Pro nás to není tak zásadní problém, protože známe význam slova jako takového. Pro koně může být ale změna intonace matoucí.
V samém začátku, kdy se seznamujete s pozitivním posilováním vy i kůň, je šikovné, i když nikoliv nezbytně nutné, začít používat právě klikr. Jednoduše proto, že je to pro vás oba snadnější. Od vás to vyžaduje méně soustředění na to, co děláte vy sami. Po pár kliknutích už na stisknutí klikru nebude potřeba myslet a bude snazší soustředit se na koně. Pro koně bude snazší pochopit souvislost mezi jediným zřetelným, docela nezaměnitelným zvukem a následnou odměnou.

Příště: Způsoby práce s klikrem

Text: Michal Jílek
Foto: Archiv Blíž ke koním

(vyšlo v časopise Koně a hříbata 7/2016)