313. Hoe moeilijk wetenschap is

Posted on 24 nov 2020 in Blog, Featured

313. Hoe moeilijk wetenschap is

Afgelopen zomer schreef ik een paar artikelen over de hausse aan samenzweringstheorieen, en hoe die te verklaren valt. Enerzijds spelen daar moderne sociale fenomenen mee als een toenemend schijnnieuws en een overheersing van de melodramatische vertelvorm. Anderzijds is ons complotdenken niet meer dan de uitvergroting van oude psychologische tendensen als cognitieve gemakzucht, WatJeZietIsAllesWatErIs, intentioneel/causaal interpreteren, sprekende voorbeelden en gevoelsheuristiek.

De psychologische neigingen om niet bestaande patronen te zien en deze om emotionele, monetaire en politieke redenen te verspreiden zijn oud, heel oud. Een deel van zeer oude vormen van religie en bijgeloof kunnen we beschouwen als voorbeelden van magisch denken dat de basis van complotdenken vormt – bijvoorbeeld de interpretatie van de goddelijke wil uit de richting van bliksem of uit de lever van een gans.

Tegen die vertekenende aanvechtingen heeft de mensheid heel langzaam een tegengif ontwikkeld, dat maar sinds kort sterk genoeg is om (sommige, niet alle) onwaarheden af te weren: wetenschap. De wetenschappelijke methode, met een wisselwerking van theorievorming en empirisch onderzoek biedt de beste mogelijkheid om niet door bullshit, nepnieuws, halve waarheden en hele leugens getroffen te worden.

De beste mogelijkheid – dat betekent niet feilloos. Net als een vaccin werkt wetenschap niet voor de volle honderd procent.

Onwetenschappelijke wetenschap
Hoewel wetenschap onze beste verdediging tegen onwaarheid en bullshit vormt, is wetenschap zelf ook maar een menselijke activiteit en dus onderhevig aan menselijke zwakheden. Wetenschappers zitten zelf vol van verschillende vormen van vooroordeel (oftewel bias), terwijl de heuristiek (de zoekstrategie) van het wetenschappelijk bedrijf bullshit, schijnnieuws en melodrama voortbrengt.

Vooroordeel/bias: allereerst heeft elke wetenschapper of wetenschapster natuurlijk emoties die het onderzoek kleuren. Sommige uitkomsten wil je heel graag werkelijkheid zien worden, andere niet – dat speelt onherroepelijk een rol in je oordelen, juist als je er niet van bewust bent.

Zelfbedrog is juist dan des te gemakkelijker, wanneer een bepaalde uitkomst moeilijk meetbaar is en er allerlei aannames nodig zijn om iets zelfs maar te onderzoeken.

Bijvoorbeeld. Je wilt onderzoeken of het spelen van gewelddadige videospellen iemand gewelddadiger maakt. Natuurlijk kun je data gaan zoeken die het plegen van geweld in verband brengen met games. Misschien zijn er relevante criminaliteitscijfers. Maar zelfs dan moet je al een heleboel keuzes maken om je onderzoek te definieren. Welke games classificeer je als gewelddadig? Spellen waar alleen maar gevochten wordt, of ook die waarin avonturen sommige gevechten bevatten? En telt alleen geweld jegens mensachtige ‘avatars’, of reken je ook gedode monsters mee? (Hoe zit het met een spel als Pac-Man?) En hoe vaak moet je dergelijke spelen doen? Dagelijks een paar uur? Af en toe? Iets er tussenin?
En welke gewelddadige misdaden betrek je in je onderzoek? Alleen moord en doodslag, of ook openbare geweldpleging, of mishandeling thuis?

En als je een experiment wilt uitvoeren, hoe doe je dat dan? Je kunt mensen moeilijk in een experimentele setting misdaden laten begaan. Welke niet-gewelddadige uiting neem je dan als vervanging? Denkbeeldig geweld, zoals in het Milgram-experiment waar mensen zogenaamd elektrische schokken moesten geven? Of verbaal geweld? Of het serveren van een scherpe saus in iemands drankje? (Ik verzin dit niet, die handeling zou volgens een sociaal-psychologisch experiment een betrouwbaar signaal zijn van agressie en indirect van gewelddadige neigingen.)

Elke keuze, elke aanname die je maakt bij een experiment, heeft invloed op de resultaten die je vindt – en elk mens is heel goed in staat aannames te verdedigen die een gewenst resultaat legitimeren. Zeker een slimme wetenschapper. Sterker nog, slimme wetenschapeprs zijn beter dan wie dan ook in staat om argumenten te vinden die hun hypothese rechtvaardigen.

th

Een belangrijkere bias nog dan emotionele investering in een betekenisvolle resultaat, is de zucht naar betekenis zelf, de zucht naar een verklaring.
Op het eerste gezicht zal dat vreemd lijken: is niet de hele wetenschap een grote zoektocht naar een verklaring van de wereld, een aaneenrijgen van ogenschijnlijk losstaande fenomenen middels de rode draad van een samenhand, logisch verhaal? Is die betekenis niet het hele doel van wetenschap?
Precies. En daarom is de neiging ook zo verraderlijk.

Een wetenschapper wordt gedreven door het verlangen in elke verzameling feiten een patroon te zien, dat de feiten verklaart. Een wetenschapper is een patronenschepper, gedreven door dat ene, alles overheersende principe: dat niks in de wereld zonder betekenis is, dat er altijd oorzaken, of op zijn minst statistisch relevante correlaties, te vinden zijn. Wetenschappers zijn altijd op zoek naar de orde, zelfs binnen toeval en chaos.
Dat uitgangspunt is meer dan uitstekend – het is de raison d’etre van de wetenschap. Tegelijk is het de grootste valkuil.

Dwangmatige patroonherkenning (of beter: patroonschepping) kan gemakkelijk leiden tot denkfouten. Met name tot de ‘verhaal-fout’ of narative fallacy in de term van Nassim Nicholas Taleb:

De narrative fallacy gaat over ons beperkt vermogen om naar een reeks van gebeurtenissen te kijken zonder er een verklaring in te weven of, wat hetzelfde is, er een logische link, een relatie-pijl op te drukken. Verklaringen binden feiten bijeen. Ze zorgen ervoor dat we ze gemakkelijker kunnen onthouden; ze maken ze begrijpelijker. Waar deze neiging de mist in kan gaan is wanneer hij ons de indruk geeft dat we iets begrijpen.

Wanneer wij naar de sterren kijken, zien we er sterrenbeelden in: niet bestaande figuren als de Boogschutter of de Grote Beer. We nemen een handvol willekeurige lichtpuntjes en weven daar een patroon van.
Wetenschappers zijn doorgaans kritischer op hun ‘waargenomen’ patronen dan astrologen – maar de neiging om voortdurend naar patronen te zoeken maakt ze toch vatbaar voor de verhalen-fout.

Daarbij komt dat het wetenschappelijk bedrijf in zijn geheel alleen waargenomen patronen beloont, niet chaotische willekeur. Wanneer, bijvoorbeeld, een econoom, naar verschillende economische indicatoren kijkt en zegt dat er hij er geen verband tussen waar kan nemen, zal niemand die (negatieve) waarneming publiceren en geen universiteit zal hem aannemen. Alleen de econoom die een regelmatige correlatie tussen, bijvoorbeeld, belastingen en inflatie, ziet, zal een gehoor vinden.

th-1

Wanneer een wetenschapper dus een zwak statistisch verband vindt tussen enkele factoren – of het nu een economische maatregel en belastingopbrengst, of de inname van een medicijn en gezondheidswinst betreft – zal hij dat zwakke verband niet verder gaan beproeven, met het risico dat de zaak in elkaar stort. Hij zal het verband zo sterk mogelijk verwoorden en een eventuele weerlegging aan anderen laten.
In veel gevallen zal voor die weerlegging echter geen ruimte zijn. Waarom niet?

Neem een simpel voorbeeld, verteld door Tim Harford in zijn recente How To Make The World Add Up.

Een aantal jaren geleden maakten een paar onderzoekers naam door een opvallende proef: ze gaven consumenten de keuze uit een assortiment van zes soorten jam en een assortiment van vierentwintig soorten. En wat bleek: de consumenten met een minder gevarieerd aanbod kochten meer jam dan de mensen die meer keuze hadden gehad! Moraal van de onderzoekers: soms kan er te veel te kiezen zijn.

Dit onderzoek is beroemd geworden omdat het voldoet aan criterium 1 voor relevantie en beroemdheid: het is nieuw en tegelijk verrassend. Het is intrigerend (want tegenintuitief) maar niet zo raar dat het ongeloofwaardig wordt.
Zo’n onderzoek zal een tijdschrift graag publiceren.

Stel nu, het onderzoek had het tegendeel uitgewezen: meer keuze verleidt meer mensen tot kopen (wat je zou verwachten, omdat dan meer mensen iets van hun gading kunnen vinden). Die conclusie zou niemand verrast hebben en de neiging om een dergelijk resultaat te publiceren zou veel minder sterk zijn. Nieuw maar niet verrassend wint het niet van nieuw en wel verrassend.

En de weerleggingen van ‘minder keuze is beter’ hebben het nog moeilijker om de aandacht te trekken: die moraal is namelijk EN niet nieuw EN niet verrassend. Daar zit geen tijdschrift op te wachten.

Wanneer er eenmaal een interessant resultaat is gepubliceerd, is het daarna heel moeilijk de niet interessante correctie te verspreiden. En aangezien tegenwoordig alles in de wetenschap afhangt van publicaties, is er heel heel grote neiging om bullshit te verspreiden: wetenschappelijke ontdekkingen die misschien niet allemaal onwaar zijn, maar waarbij waarheid in elk geval niet het doorslaggevende criterium van verspreiding vormde.

Voordat de resultaten van objectief onderzoek bij ons, het publiek, terechtkomen, zijn ze dus al door een reeks van subjectieve filters gegaan. Eerst heeft de wetenschapper gezocht naar interessante patronen. Als hij die gevonden heeft, schrijft hij ze op de meest sterke en interessante manier op. Wetenschappelijke tijdschriften selecteren uit die onderzoeken weer de meest interessante, en de meest interessante van die gepubliceerde conclusies komt (via de filters van samenvattingen en persberichten) bij journalisten, die er voor hun stuk vaak weer de meest interessante zaken uit halen.
Wij leken/lezers krijgen van die hele ijsberg alleen het topje te zien en denken dan dat er een saillant stukje van de werkelijkheid mee beschreven wordt. Terwijl de onderliggende massa aan data misschien een heel ander beeld geeft.

Gelukkig kunnen we ook een heleboel dingen doen om de ‘weet’ in wetenschap te versterken. Maar daarover een volgende keer meer!