Theorie en praktijk van
Leerprincipes bij paarden
Hoe leren paarden? De wetenschap heeft zich uitvoerig over dit vraagstuk gebogen en inmiddels de nodige antwoorden gevonden. Deze komen samen in de leerprincipes van het paard. Met gedragsdeskundige Marc Pierard nemen we de meest bekende van deze leerprincipes door en slaan we een brug naar de praktijk.
Tekst Peter van Pinxteren Beeld Arnd Bronkhorst
Dr. Marc Pierard is gepromoveerd op de toegepaste ethologie van het paard en zeer bekend met de leerprincipes. Voordat we toekomen aan het benoemen, uitleggen en de toepassing van de meest relevante principes benadrukt de Belgische gedragsdeskundige: “Een van de belangrijkste boodschappen voor mij is dat je niet universitair geschoold hoeft te zijn om dit te kunnen toepassen. Het klopt dat de wetenschap hiermee bezig is geweest en dat misschien enkele benamingen wat ingewikkelder klinken, maar de dagelijkse toepassing kan iedereen en is niet heel complex. Daarbij hoef je zeker niet alles dat je tot heden hebt gedaan en geleerd uit het raam te gooien en weer op nul te beginnen. Laatst stond in een artikel dat er bewijs is geleverd dat we al meer dan vijfduizend jaar paardrijden. En wat we al vijfduizend jaar doen, werkt omdat het past binnen die principes. Alleen zijn we ons er niet altijd van bewust en passen we ze niet altijd optimaal toe.”
|1| Gewenning
“Als ik kijk naar de opbouw van een training van een jong paard begin het eigenlijk al bij het veulen. Je begint dan met het leerprincipe van de gewenning, oftewel habituatie. Je moet eerst in de buurt kunnen komen, een veulen kunnen aanraken en een halster kunnen aandoen. Als dat al niet kan, kun je het paard niks anders leren.
Van nature is een paard wat neofoob, oftewel een beetje schrikachtig voor nieuwe dingen. Gewenning is niets anders dan een paard leren dat hij ergens niet bang voor hoeft te zijn en dat hij het kan negeren. Daar is een aantal technieken voor. Wat je het beste niet kunt doen, is zeggen tegen het paard, ‘je moet er maar tegen kunnen’, en het vervolgens overvallen. Dat heet in vaktermen flooding. Bijvoorbeeld wanneer je het paard zadelmak wilt maken en dat doet door vlug het zadel erop te gooien, snel aansingelen en het paard vervolgens laten bokken tot het stopt.
Daarmee loop je het risico dat het paard de rest van zijn leven een hekel heeft aan zadels en krijg je het tegenovergestelde van habituatie, namelijk sensitisatie, gevoeliger worden voor iets nieuws. Daar moet je voor oppassen. Je doet het dus juist geleidelijk. Laat het paard snuffelen aan het zadel, leg het enkele seconden op de rug en haal het dan weer weg. Houd de singel even tegen de buik aan, haal deze weer weg, enzovoort. Als je het goed doet, is de kans groot dat het paard amper en liefst helemaal niet zal bokken en geen angst ontwikkelt voor het zadel.
“Op gewenning bij het paard hebben wij al duizenden jaren geselecteerd. Met welke wilde paarden ging de mens verder? Die paarden waar je bij in de buurt kon komen en die je kon aanraken. Neem je bijvoorbeeld een zebra, dan zie je bij deze diersoort beduidend minder gewenning optreden, waardoor ze veel meer angst tonen en langduriger een reactie geven. De eigenschap van gewenning zit dus in onze paarden verankerd. Dat wil niet zeggen dat een paard zover is dat hij alles aanvaardt en kent. Wanneer hij een mens voor de eerste keer ziet, weet hij niet dat dit geen kwaad kan en hetzelfde geldt voor een zadel, trailer, een eerste wedstrijd, vlaggen, publiek, et cetera. Dat moet je hem allemaal leren, maar er is dus wel geselecteerd op paarden die daar makkelijker in meegaan en dat kunnen leren. Zorg er wel voor dat je zaken geleidelijk opbouwt, zodat gewenning kan optreden. Jaag hem niet in een hoge mate van angst en stress en zet hem niet onder druk. Je riskeert dan dat het paard jou ziet als bron van stress in plaats van bron van geruststelling.”
‘Van nature is een paard wat neofoob, een beetje schrikachtig voor nieuwe dingen’
Bij een jong veulen begin je al met het leerprincipe van de gewenning, oftewel habituatie.
Marc Pierard: 'De eigenschap van gewenning zit in onze paarden verankerd.'
|2| Operante conditionering: bekrachtiging en straffen
“Het tweede leerprincipe dat je vaak gebruikt, heet met een duur woord operante conditionering. Het basisprincipe is simpel en komt voort uit Edward Thorndike’s ‘Wet van het effect’, zo rond de jaren 1900. Dit zegt gewoon dat een dier bepaald gedrag vaker gaat vertonen als het hem iets oplevert dat hij graag heeft. Wanneer bepaald gedrag hem iets oplevert dat hij niet graag heeft, gaat hij dat juist minder doen. Iets dat hij graag heeft, noemen we een bekrachtiging. Het tegenovergestelde noemen we straffen. Het laatste probeer je zoveel mogelijk te vermijden, omdat je daarmee alleen tegen een paard zegt, ‘dit mag je niet doen’, terwijl het dan nog niet weet wat het wel mag doen. We weten dat paarden die veel met straf getraind zijn eerder bevriezen bij iets nieuws, en een paard dat positief is getraind juist ervoor openstaat om weer iets nieuws te leren. Ik zou straffen beperken tot wanneer iets gevaarlijk wordt, voor jezelf of voor anderen. Dan is het ook voor de korte termijn. Voor de lange termijn is het zelden een duurzame oplossing. En als je het gebruikt, moet je het correct gebruiken. Het mag nooit echt pijnlijk zijn, want opnieuw kan het paard een negatieve associatie met jou leggen en je zien als iemand die pijn veroorzaakt. Het moet voor het paard onaangenaam zijn. Als een paard bijvoorbeeld bijt, kun je hem een tik geven tegen zijn gevoelige neus. De timing daarbij is ook belangrijk.”
‘Voor de lange termijn is straffen zelden een duurzame oplossing’
|2a| Negatieve bekrachtiging
“Duidelijk mag zijn dat we in de training veruit het vaakst het leerprincipe van de bekrachtiging toepassen. Je hebt bij bekrachtiging, en overigens ook bij straffen, dat je iets kunt toevoegen en iets kunt wegnemen. Daarvoor bestaan de termen positief en negatief. Dat heeft helemaal niks te maken met goed of slecht, maar alleen met, ik voeg iets toe, dus positief, of ik haal iets weg, dus negatief.
Negatieve bekrachtiging in de training wil zeggen dat je wat druk zet en zodra het paard de gewenste respons geeft, laat je de druk wegvallen. Het woord negatief slaat dan op het weghalen van die druk. Een simpel voorbeeld. Ik neem wat druk op mijn teugels om het paard te laten stoppen. Het stopt vervolgens en dan laat ik die druk meteen wegvallen door te ontspannen in de teugel. Of ik nijp met mijn benen om vooruit te gaan. Hij gaat vooruit en ik stop met nijpen.
“Dat is negatieve bekrachtiging, iets waar we bij het opleiden van een paard voor een groot gedeelte op terugvallen. Dat is zeker niet zo slecht als sommige mensen denken. Soms wordt het zelfs afgeschilderd alsof je paarden hiermee mishandelt. Je kan een paard met lichte druk, als je dat correct en consequent toepast, juist veel laten doen, en dan is er zeker geen sprake van angst of pijn veroorzaken. Het levert eerder een positief resultaat op voor het paard, dat van nature ervoor open staat om te leren. Natuurlijk is het verhaal anders als je flink aan de teugels gaat trekken. Het streven is juist om het paard met lichte, fijne hulpen te rijden. Wel komt hier rijtechniek bij kijken. Als jij onregelmatig in je zadel zit, onrustig met je handen bent en ook voortdurend met je benen zit te nijpen, kun je nooit lichte hulpen op je paard installeren. Dan is de achtergrondruis veel te hoog voor het paard om je te begrijpen. Als je ruiter wordt, moet je beseffen dat je moet werken aan jezelf. Dus kennis hebben van die leerprincipes om te weten hoe je het paard psychologisch bereikt én zelf fysiek de signalen correct geven.”
Een eerste keer een ruiter op de rug voelt nog onwennig voor het paard.
|2b| Positieve bekrachtiging
“Naast negatieve bekrachtiging maak je gebruik van positieve bekrachtiging. Je voegt iets toe als het gewenste gedrag wordt getoond.
Het paard doet wat ik wil en krijgt van mij bijvoorbeeld een stukje appel, als dat werkt voor dat specifieke paard. Je kan dit op verschillende manieren doen. Zo geef je bijvoorbeeld het paard een snoepje bij een nieuwe oefening, als het deze goed uitvoert. Je hoeft natuurlijk niet telkens een snoepje te geven als het paard die oefening doet. Neem het leren van een volte. Je draaft bijvoorbeeld eerst een halve volte, vraagt het paard om te stoppen en geeft hem een snoepje. Dat doe je een paar keer en als het goed gaat, ga je voor de hele volte. Je geeft hem de beloning en bouwt het vervolgens nog verder uit naar twee hele voltes achter elkaar. Daarna ga je het belonen afbouwen, want hij kent de oefening. Wat je nog kan doen is af en toe, op een onvoorspelbare manier, toch nog een snoepje geven als beloning. Dan stimuleer je de hersenen op een wijze dat het paard graag zijn best doet. “Tot nu toe blijkt uit wetenschappelijk onderzoek dat voedselbeloning het beste werkt. Heel enthousiast op de nek kloppen als beloning is niet iets waar ze plezier aan beleven. Er zijn wel studies waaruit blijkt dat als je op of bij de schoft krabbelt hun hartslag daalt (zie kader ‘To-do lijstje’). Dus dat lijkt ook te werken, maar we weten dat voedsel hen nog meer motiveert.
“Een paard dat goed met positieve en negatieve bekrachtiging getraind is, biedt van alles aan en daar kun je fijn mee werken. Een belangrijk ding is dat mensen soms denken dat ze moeten kiezen tussen positieve of negatieve bekrachtiging, maar je hebt ook gecombineerde bekrachtiging, waarbij je beide gebruikt. Ik geef bijvoorbeeld druk op mijn bit omdat ik wil dat het paard stopt en zodra hij stopt, krabbel ik hem op zijn schoft. Daar is helaas nog wat weinig onderzoek naar gedaan en dus eentje die ook nog op mijn to-do lijstje staat.”
‘Een paard dat met positieve en negatieve bekrachtiging getraind is, biedt van alles aan’
|3| Klassieke conditionering
“Je kunt positieve bekrachtiging koppelen aan bijvoorbeeld een clicker, zoals bij clickertraining. Als het gewenste gedrag getoond wordt, markeer je dit door die clicker te gebruiken en daar achteraan een stukje appel te geven. Dat brengt ons bij het volgende leerprincipe waar we gebruik van maken, en dat is de klassieke conditionering. Want waarom werkt die clicker? De eerste keer als het paard die klik hoort, zegt hij ‘o een geluidje, so what’, maar als die klik telkens betekent dat twee seconden daarna een stukje appel volgt dan legt het paard na een paar keer al een verband tussen de klik - die eerst neutraal was - en het feit dat er daarna iets volgt, in dit geval een beloning. Je kunt die klassieke conditionering met van alles doen, met stemcommando’s of onze houding. Eigenlijk worden onze zithulpen geïnstalleerd bij het paard door klassieke conditionering. We leren eerst het paard om om te gaan met druk op de teugels en met de benen, maar daar voorafgaand veranderen we - vaak onbewust - een klein beetje onze houding. Het paard leert dat op te pikken en reageert op den duur al op die iets veranderende houding. Ruiters zeggen wel eens ‘hij kan mijn gedachten lezen’, maar hij kan je lichaam lezen. Het paard denkt, ‘hé hij bereidt zich voor om been te geven, ik zal alvast vertrekken.’ Paarden voelen iets aankomen, waar wij onszelf niet bewust van zijn, zoals die minimale verschuiving in het zadel van enkele millimeters. Ook hier komt de rijtechniek weer om de hoek kijken. Als je constant onrustig zit in je zadel werkt dit natuurlijk niet, maar als je een onafhankelijke zit hebt en consequent met je hulpen bent wel. Je wilt bij X in galop gaan en je spant net voor X je spieren aan, dan weet het paard wat er gaat gebeuren en volgt de overgang automatisch. Dat is klassieke conditionering. Je installeert iets nieuws dat iets aankondigt dat hij al kent en dan gaat hij op dat nieuwe signaal al reageren.
“Je ontwikkelt met behulp van de leerprincipes als het ware een nieuwe taal tussen jou en je paard. De ‘woorden’ die je gebruikt, moeten wel altijd hetzelfde betekenen, anders krijg je verwarring en kan het paard onzeker worden en zelfs stress krijgen.”
Paarden hebben van nature een zekere mate van nieuwsgierigheid en staan er ook voor open om te leren.
Bij goed gebruik van de leerprincipes leert een paard snel vertrouwen op de ruiter.
|Drie essentiële basisprincipes|
Voor het op juiste wijze toepassen van de genoemde leermechanismen is het cruciaal om drie basisprincipes daarbij te hanteren:
- Geleidelijke opbouw -shaping in vakjargon- van alle oefeningen, zodat je het paard zowel fysiek als mentaal niet overvraagt.
- Juiste timing: Dit bepaalt of een paard zal begrijpen wat je bedoelt. Oftewel, bij negatieve bekrachtiging de druk loslaten zodra je de gewenste respons krijgt, bij positieve bekrachtiging belonen zodra je de gewenste respons krijgt, bij straf dit uitvoeren tijdens of onmiddellijk na het ongewenste gedrag en ophouden zodra het paard stopt met het ongewenste gedrag en bij klassieke conditionering het nieuwe signaal geven vlak voor het gekende signaal.
- Generalisatie: Het paard moet de kans krijgen geleidelijk te leren dat een andere context er niet toe doet. In een andere omgeving of onder andere omstandigheden blijven jouw signalen hetzelfde en blijven ook de gevraagde responsen dezelfde voor het paard. Neem springpaarden die verschillende soorten hindernissen moeten leren springen. Het paard leert bijvoorbeeld dat de kleur van de balken er niet toe doet en het gevraagde binnen een andere context hetzelfde blijft.
LEERPRINCIPES EN INSTRUCTEURSOPLEIDINGEN Het paard leert enorm snel. Toch gebruiken we als paardenliefhebbers de leerprincipes nog niet vaak bewust. Als ruiter en instructeur is het juist belangrijk -en handig - om te weten hoe het paard leert. Zo kun je het paard een figuur of nieuw gedrag op een wijze aanleren, dat zowel mens als paard er plezier bij heeft. De leerprincipes worden nu al meegenomen in de KNHS-instructeursopleidingen en vanuit de KNHS zijn we dit verder aan het uitbreiden, omdat er steeds meer bekend wordt over hoe we het leren zo leuk en effectief mogelijk voor het paard kunnen maken.
‘Onze zithulpen worden eigenlijk geïnstalleerd bij het paard door klassieke conditionering’
To-do lijstje
Naast de genoemde, meest gebruikte leerprincipes zijn er nog beduidend meer wetenschappelijk vastgelegd. Een voorbeeld daarvan is counter-conditionering, waarbij je iets waar het paard angst voor heeft aangenaam maakt. Of de zogenaamde prediction error, oftewel voorspellingsfout. Het paard verwacht iets vanuit eerdere ervaringen, maar krijgt juist minder (negatieve voorspellingsfout) of meer (positieve voorspellingsfout) dan hij had verwacht.
Veel is dus al bekend, tegelijkertijd blijft er nog genoeg over om te onderzoeken, zo maken we uit de woorden van dr. Pierard op. Hij zegt: “Op mijn to-do-lijstje staat nog het kijken naar de relatie tussen paard en mens in onderzoek naar beloningen en positieve bekrachtiging. Tot nu toe hebben deze studies altijd plaatsgevonden met een mens, die de paarden niet kenden. Bij paarden zelf zien we dat ze groomen met soortgenoten waar ze een langere relatie mee hebben. Ik zou graag een studie doen waarbij er eerst een relatie met het paard wordt opgebouwd om dan te zien hoe belangrijk dat krabbelen bij de schoft wordt als beloning. Mijn hypothese is dat het dan belangrijker wordt. Ik zeg niet dat je hoger gaat geraken dan voedsel als beloning, maar wel dat je het belang van krabbelen kunt verhogen door een relatie met het paard op te bouwen. Stel je voor dat je zelf op straat door een wildvreemde wordt omarmd. Dat is toch duidelijk anders dan wanneer dit gebeurt door iemand die je goed kent en vertrouwt.” <