Moet je leerlingen betalen voor goede onderwijsprestaties? Ja, meent René Kneyber op 10 maart 2010 in Trouw. Volgens Amerikaans onderzoek werkt het goed, en is het goedkoper dan allerlei leerwegondersteunende maatregelen. Niet handig, aldus Mirre Stallen op 24 februari 2014. Volgens haar leer je kinderen op die manier dat eigenschappen zoals inzet en verantwoordelijkheid te koop zijn.
De vraag hoe leerlingen het best zijn te motiveren, raakt de kern van moderne onderwijspsychologie. Deci en Ryan (1985, 2000) stellen in hun toonaangevende self determination theory dat kinderen een natuurlijke nieuwsgierigheid bezitten die lesgevers moeten aanboren. Een goede docent speelt in op de behoefte aan intieme relaties die kinderen willen aangaan met elkaar, de leerkracht en de eigen omgeving, de natuurlijke behoefte tot autonomie (de wens zelf eigenaar te zijn van de leerdoelen, en de weg daarnaartoe) en het gevoel van competentie van de leerling: de leerling moet zich uitgedaagd voelen, maar moet niet het gevoel hebben te worden overvraagd. Wordt aan deze drieslag voldaan, dan is leren voor de scholier bevredigend en voelen zij zich gemotiveerd vanuit intrinsieke voldoening.
Deze focus op individuele zelfontplooiing en bevrediging als ultiem doel is relatief nieuw, betogen de psychologen Eisenberger, Pierce en Cameron (1999). De nadruk op het individu is een typisch westerse constructie die de oorsprong heeft in de Europese romantiek en de Amerikaanse pragmatiek.
Dit betalingendebat kan dus gesitueerd worden in het filosofische discours over de verhouding tussen collectief en individu; enerzijds weten we uit de psychologie dat mensen gevoeliger zijn voor concrete kortetermijnbeloningen dan voor abstracte langetermijnbeloningen en anderszijds weten we ook dat kinderen heel gevoelig zijn voor de mores van de peers. Kneyber zit in het kamp van de indivualisten, Stallen behoort tot de collectivisten.
Oude wijn in nieuwe zakken
De ‘financiële prikkel’ om gewenst gedrag te stimuleren is ook al oud. In de 19e eeuw werden er in het verre Drenthe en Overijssel veenkoloniën opgericht waar de arme paupers van de grote binnensteden een eigen huis en een stuk land kregen, mits ze een deugdzaam leven bleven leiden, zonder drank en met een trouwe kerkgang. Terzelfdertijd experimenteerde men in New York City al met financiële prikkels in het onderwijs (Slavin 2010 & Bettinger, 2013).
Net zoals de negentiende eeuwse verheffingsidealen pasten in het romantische denken, zo passen de financial incentives in een neoliberaal wereldbeeld waarin wordt geprobeerd om abstracte fenomenen concreet uit te drukken in geld. In zekere zin is deze monetarisering van pedagogische waarden als ‘doorzettingsvermogen’, ‘verantwoordelijkheid’ en ‘solidariteit’ dus niets anders dan oude wijn in nieuwe zakken.
In 2010 werd door onderwijsonderzoeker Robert Slavin, verbonden aan de John Hopkins Universiteit en de Universiteit van York een grote meta-analyse gedaan om de staat van het onderzoek naar financiële prikkels in het onderwijs in kaart te brengen. Een meta-analyse van literatuur wordt beschouwd als een van de krachtigste methoden die wetenschappers tot hun beschikking hebben, in tegenstelling tot bijvoorbeeld een experiment of een enquête, omdat een meta-analyse heel veel verschillende onderzoeken met elkaar combineert en zo een completer en betrouwbaarder beeld geeft. Slavin geeft goed aan hoe er is gezocht, en welke soorten onderzoeken in de meta-analyse zijn meegedaan. Een vraag die er bij de gemaakte keuze wel gesteld moet worden is waarom er alleen gezocht is op (kinderen uit) achterstandsgezinnen. Klaarblijkelijk veronderstelt Slavin dat betaling voor kinderen uit middenklasse- of hogere-inkomensgroepen een wetenschappelijk minder relevante groep vormen.
Ook maakt Slavin onderscheid tussen onderwijsgedragingen die te maken hebben met wilskracht, zoals op komen dagen voor de les en huiswerk maken, en gedragingen die vooral te maken hebben met aspiraties, zoals de wens van de leerling om de leeropbrengst te vergroten.
Het is jammer dat Slavin niet precies duidelijk maakt hoe hij deze termen heeft geoperationaliseerd in zijn analyse. De constructvaliditeit van de taak (wilskrachtig of aspirationeel) blijft zodoende hangen op een definitieniveau, maar helaas wordt niet uitgelegd hoe deze zaken (controleerbaar en repliceerbaar) zijn getest.
Uiteindelijk werden de uitkomsten van twintig grootschalige experimenten overal ter wereld bestudeerd waarin arme kinderen tenminste een jaar geld kregen voor schoolprestaties en waarbij deze groep werd vergeleken met een controlegroep. De scores van de experimentgroep en de controlegroep moesten bij een nulmeting vergelijkbaar zijn (de statistische definitie voor vergelijkbaarheid was volgens Slavin een verschil van maximaal 50% van een standaardafwijking).
Als er al een effect is, dan is dat effect klein en vaak niet significant.
Slavin ontdekte dat vooral de wilskrachtgedragingen in ontwikkelingslanden door de financiële prikkel kunnen worden vergroot. Zo kwamen er tussen de drie en de twaalf procent meer leerlingen voor lessen opdagen.
De aspiratiegedragingen worden niet significant beïnvloed door de betalingen (met significant wordt bedoeld dat de kans dat toeval bij de metingen een rol heeft gespeeld zo klein is, dat wetenschappers deze durven uit te sluiten – doorgaans hanteert men een bovengrens van 5%), en de effecten voor het moderne westerse onderwijs zijn niet of nauwelijks consistent. Als er al een effect is, is dit effect klein en vaak zijn gemeten effecten niet significant.
Criticasters van betalingen aan leerlingen in ontwikkelingslanden hebben opgeworpen dat het geld dat wordt gebruikt voor het betalen van leerlingen, beter kan worden besteed aan het scholen van onderwijzers, en/of het goedkoper maken van leermiddelen zoals pennen, schriften en boeken.
Experiment
Een experiment waar wel aandacht werd besteed aan de leeropbrengsten vond plaats in Coshocton Ohio, een arm, overwegend blank plaatsje aan de voet van de Appalachen. Er werd via een loterij willekeurig een groep leerlingen op de basisschool geselecteerd die een financiële prikkel kreeg om goed te presteren. De kinderen kregen vijf gestandaardiseerde toetsen: lezen, schrijven, wiskunde, natuur- en scheikunde, en de ‘sociale studies’ (onder andere geschiedenis, sociale geografie & maatschappijleer). De geselecteerde leerlingen kregen $15 voor elke test waarin zij goed scoorden en $20 waarvoor zij een prima haalden.
Het bleek dat alleen voor de wiskunde toetsen een significant resultaat kon worden gevonden, een effect dat overeenkomt met eerdere bevindingen en wordt geweten aan de lagere mate aan ‘conceptualiteit’ van de wiskundetaken (Lepper & Green, 1978). Helaas wordt niet verder uitgewerkt wat daar precies onder wordt verstaan.
De prikkel bleek niet in staat extra kinderen van basisniveau naar het goede niveau te trekken, maar wel om de goede kinderen een stapje extra te laten zetten en zo in de prima categorie te laten komen (Bettinger, 2013).
Experimenten in het onderwijs zijn kwetsbaar van opzet, omdat het vaak lastig is te bewijzen dat de interventie de beslissende factor is geweest in het verklaren van eventuele verschillen tussen experimentgroep en controlegroep. Er zijn vaak heel veel interveniërende factoren. Het onderzoek maakt bijvoorbeeld niet duidelijk of de andere leerlingen wisten dat een deel van hun klasgenootjes geld kregen voor een taak waar zij niets extra’s voor verdienden. Het blijft op die manier onduidelijk of significante afwijking in wiskunderesultaat is toe te schrijven aan extra motivatie bij de experimentgroep, of juist aan demotivatie uit jaloezie bij de controlegroep.
Enkele docenten begonnen hun wiskunde-instructie met de woorden ‘Show me the money!’ of behingen hun lokaal met kopietjes van honderddollarbiljetten.
Ook over de invloed van de docent in het experiment is het gemakkelijk kritisch te zijn: dit niet overal gelijk was: sommige docenten hebben duidelijk gestuurd op de betaling. Enkele docenten begonnen hun wiskunde-instructie met de woorden ‘Show me the money!’ of behingen hun lokaal met kopietjes van honderddollarbiljetten. Andere docenten deden dit niet.
Een derde gevaar bij onderwijsexperimenten is de statistische analyse van de gegevens. Omdat een basisschool vaak in een bepaalde buurt gelegen is, en deze buurt een bepaalde huizenprijs kent en zodoende sorteert op allerlei sociaal-economische indicatoren, zijn er vaak geavanceerde technieken zoals factor- of clusteranalyse nodig om te corrigeren voor verschillen tussen groepen. Vaak is een statistisch significant verschil tussen groepen niet toe te schijven aan de interventie, maar eerder aan een selectiebias in opleidingsgraad en inkomen van ouders.
In het Coshocton experiment heeft men via een loterij willekeurig leerlingen toegeschreven aan de experimentgroep, en vervolgens via eenvoudige t-toetsen deze groepen met elkaar vergeleken, maar de eenheid van willekeur bleef de klas (en dus de school en dus de buurt). Er valt dus wel degelijk wat af te dingen op de statistische toetsen die zijn gehanteerd. Ofwel men had als eenheid de leerling moeten nemen, ofwel men had beter een geavanceerdere techniek gebruikt.
Al dit wetenschappelijk geharrewar ten spijt, blijkt de opvatting van zowel Kneyber (het werkt, dus doen) als die van Stallen (er er zijn betere alternatieven) tegelijkertijd waar èn niet waar.
Er zijn aanwijzingen dat voor bepaalde, wilskrachtige taken (zoals de moeite nemen en op komen dagen) en taken die van nature minder conceptueel zijn (zoals wiskunde op de basisschool in tegenstelling tot bijvoorbeeld lezen) het betalen van leerlingen kan werken. Voor taken waarvoor leerlingen al intrinsiek gemotiveerd zijn, werkt betaling juist negatief (Deci en Ryan, 1999).
Praktijkgericht vervolgonderzoek
Als mentor van een HAVO 2 heb ik dagelijks te maken met leerlingen die voor verschillende taken op verschillende manieren zijn te motiveren. De relatie met de docent en de betekenisvolheid van het vak en taak lijken daarin doorslaggevend. Voor authentieke taken die leuk en betekenisvol worden gevonden, waar leerlingen zelf eigenaar zijn van het product, zich bekwaam genoeg voelen om hun doelen te halen, èn waar de relatie met de collega deugt, daarvoor wordt hard gewerkt en zijn de resultaten meestal dik in orde.
Voor saaie, irrelevante taakjes in situaties waar de betreffende collega het klassenmanagement niet voldoende onder controle heeft, gaat een substantieel aantal kinderen gewoon niet aan de gang. Zij calculeren het slechte cijfer in, en laten het vak na de derde klas vallen.
In deze schoolcontext zou ik als mentor misschien de extrinsieke motivator kunnen zijn, waar de intrinsieke motivatie ontbreekt. Ik zou de leerlingen kunnen vragen voor welke taken zij zich niet gemotiveerd voelen, en voor welke taken wel. Dit kan op verschillende manieren, maar een gestructureerd interview heeft mijn voorkeur omdat ik dan gelijk kan checken of de leerling de vragen en stellingen goed begrijpt en zodoende op ‘de juiste manier’ antwoordt.
Daarna kan ik een prikkel verzinnen om hen extra te motiveren voor de taken die zij het vervelendst vinden. Mijn persoonlijke voorkeur gaat om politieke redenen niet uit naar een betaling in geld, maar ik maak al regelmatig weddenschappen om een reep chocola om leerlingen aan te sporen wat extra hun best te doen, dus in die ordegrootte kan worden gedacht.
Het mechanisme dat ik probeer te aan te spreken, is dat er daadwerkelijk meer inzet wordt gepleegd getoond voor ‘vervelende’ of ‘nutteloze’ taken en wanneer leerlingen dan een paar succeservaringen hebben, hoop ik dat zij dit naast mijn beloning ook meer voor zichzelf gaan doen. Eisenberger, Pierce en Cameron (1999) stellen in hun general interest theory dat intrinsieke en extrinsieke motivatie niet zo streng van elkaar moeten worden gescheiden, maar dat een extrinsieke prikkel soms kan leiden tot intrinsieke motivatie.
Vervolgens kan worden nagemeten of er ook daadwerkelijk meer inzet is, beter wordt gescoord en of de attitude ten aanzien van de taak ook (positief) veranderd is.
Bronnen
- Bettinger, E.P. (2012). Paying to learn: the effect of financial incentives on elementary school test scores. The Review of Economics and Statistics, 94, 686–698.
- Deci, E. L., & Ryan, R. M. (1985). Intrinsic motivation and self-determination in human behavior. New York, NY: Plenum.
- Deci, E. L., Ryan, R. M., & Koestner, R. (1999). The undermining effect is a reality after all- extrinsic rewards, task interest, and self-determination: reply to Eisenberger, Pierce and Cameron (1999) and Lepper, Henderlong, and Gingras (1999). Psychological Bulletin, 125, 692-700.
- Deci, E. L., & Ryan, R. M. (2000). The “what” and “why” of goal pursuits: Human needs and the self-determination of behavior. Psychological Inquiry, 11, 227-268.
- Deci, E. L. & Ryan, R. M. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55, 68-78.
- Eisenberger, R., Pierce, W. D., & Cameron, J. (1999). Effects of reward on intrinsic motivation –negative, neutral, and positive: comment on Deci, Koestner, and Ryan (1999). Psychological Bulletin, 125, 677-691.
- Kneyber, R. (2010). Beloon leerlingen voor goede prestaties. Trouw, 10 maart.
- Lepper, M. & Greene, D. (Eds.). (1978). The Hidden Costs of Reward: New Perspectives on the Psychology of Human Motivation, Hillsdale, New York: Erlbaum Associates.
- Slavin, R. E. (2010). Can financial incentives enhance educational outcomes? Evidence from international experiments. Educational Research Review, 5, 58-80.
- Stallen, M. (2014). Rotterdamse school betaalt scholieren voor cijfers: niet handig. Trouw, 24 februari.