316. Geen drama maar toeval

Posted on 15 dec 2020 in Blog, Featured

316. Geen drama maar toeval

Ik heb eerder op deze plek geschreven over onze neiging om de wereld om ons heen als een overzichtelijk drama te beschouwen – met een hoofdrolspeler (good guy/girl), een tegenstrever (bad guy/girl), een begin en einde, en een duidelijke uitkomst (goede wint: melodrama van triomf; slechte wint: melodrama van verlies). Bij die analyse zette ik het melodramatische perspectief tegenover het tragikomische. Er is echter ook een diepere tegenstelling in onze wijze van aanschouwing: die tussen het causaal-dramatisch en het stochastisch beschouwen van zaken. Anders gezegd: de wereld bezien als drama of als toeval.

De drang naar dramatische overzichtelijkheid, naar het zoeken van duidelijke patronen in de wereld, is een nuttige eigenschap die ons tal van beloningen heeft opgeleverd. Maar het willen vinden van patronen waar die (waarschijnlijk) niet aanwezig zijn, kan ook grote nadelen hebben.

Mensen hebben een neiging om altijd patronen te zien in gegevens. Desondanks missen we soms een betekenisvol patroon waar dat wel aanwezig is. In medische termen zouden we kunnen zeggen dat we de werkelijkheid testen en ten onrechte een negatieve uitkomst vaststellen: vals negatief (net als een corona-test die een besmette persoon ten onrechte gezond verklaart). Aan de andere kant kunnen we onszelf ook wijsmaken dat er een patroon is waar er feitelijk sprake is van willekeur: vals positief (als bij een corona-test die ten onrechte van iemand zegt dat die besmet is).

Foutieve patroonwaarneming komt voortdurend voor. Een zoeker naar paddenstoelen kan in een schemerig bos om zich heenkijken en tussen bladeren gemakkelijk een hanenkam of eekhoorntjesbrood over het hoofd zien. Dat is een vals negatieve waarneming.

images

Anderzijds is het aanwijzen van een ‘sterrenbeeld’ in een nachthemel, een patroon van sterren die niets met elkaar te maken hebben, een duidelijk geval van een vals positieve waarneming.

Unknown

In een eerder artikel over racisme suggereerde ik al dat het ‘patroon’ van politie-moorden op zwarte Amerikanen misschien een geval van een vals positieve patroonherkenning zou kunnen zijn.
Wanneer wij op tv voorbeelden zien van politiegeweld jegens zwarte verdachten, dan ‘moet’ daar volgens veel mensen wel een door racisme gedreven politiecultuur achter zitten. Die mishandelingen ‘moeten’ wel bedoeld zijn. We kunnen moeilijk begrijpen dat onder honderdduizenden arrestaties er altijd wel tientallen tot honderden op gruwelijke wijze mislopen – niet omdat de politie inherent gewelddadig, racistisch of ‘fascistisch’ is, maar omdat arrestaties ingewikkelde conflictsituaties zijn die snel uit de hand kunnen lopen – en de inzet, aan lijf en leden, hoog is.
Als bij die arrestaties meer zwarte mensen mensen betrokken zijn (omdat velen van hen in wijken met hoge criminaliteitscijfers wonen) en die arrestaties gefilmd worden en door media geselecteerd (terwijl uit de hand gelopen arrestaties van blanken worden genegeerd), dan is er een grote kans dat het publiek met een lange reeks van ‘racistische’ moorden wordt geconfronteerd. Ondanks dat er in de grotere set van data helemaal geen racistisch patroon te ontwaren valt.

Dit kan niet!
Ook in de laatste week kwamen er twee situaties voor waar mensen meenden patronen te ontdekken waar die er waarschijnlijk helemaal niet waren.

Het eerste voorbeeld komt uit de Verenigde Staten, waar het OM van de staat Texas een rechtszaak aanspande tegen vier andere staten, waar Joe Biden de verkiezingen had gewonnen. Bij dit proces sloten zich later nog 17 andere pro-Trump staten aan, plus meer dan honderd Republikeinse Congresleden en de president zelf.
Kern van hun aanklacht: in de avond van de verkiezingsdag, 3 november, had Trump een duidelijke voorsprong in Georgia, Pennsylvania, Michigan en Wisconsin. Tijdens het nachtelijke stemmentellen smolt die voorsprong weg en de daaropvolgende dagen draaide de uitslag steeds van Trump naar Biden. Hoe de trend van de verkiezingsavond was omgebogen wees volgens de eisers op een duidelijk patroon – van fraude.

Deze redenering – stemverhoudingen kunnen niet zo duidelijk omslaan, daar moet manipulatie achter zitten – is de kern van Trumps fraudebeschuldiging en zijn verzet tegen de verkiezingsuitslag. Een dergelijke swing kan niet natuurlijk en toevallig zijn, stelt hij, maar moet het resultaat zijn van fraude. Dat voor die fraude geen bewijs is gevonden, betekent niks. Fraude staat immers ‘vast’ – het bewijs wordt vanzelf nog wel gevonden (of niet, maar dan alleen omdat de Democraten het te goed hebben verstopt!).

In de aanklacht van Texas werd de onwaarschijnlijkheid van een spontane ommezwaai van Trump- naar Biden-stemmen op grond van wat onduidelijke aannames zelfs berekend: het zou een kans van 1 op 15 quadriljoen (1 : 15.000.000.000.000.000) zijn dat nagekomen stemmen (waaronder post-stemmen) zo duidelijk voor Biden zouden uitpakken – in een dergelijk ruime mate dat ze de grote voorsprong van Trump teniet konden doen.

Ik wil hier niet ingaan op het gebrek aan bewijs; of op de inconsistentie dat frauderende Democraten wel Biden lieten winnen, maar verzuimden de Senaat te pakken en bijna de meerderheid in het Huis van Afgevaardigden kwijtraakten; of dat in elk van de beschuldigde swing states Republikeinen een grote verantwoordelijkheid hadden in het proces – in regering, volksvertegenwoordiging of rechterlijke macht.
Mij gaat het hier om de statistische redenering: de claim dat het patroon van een Trump-trend naar een Biden-trend niet begrijpelijk of toevallig kon zijn.

Toevallig: inderdaad, dat kan niet, als je er vanuit gaat dat een stem, geteld aan het begin van de avond een net zo grote kans heeft om voor Trump te zijn als een stem die ’s nachts op de daaropvolgende dag wordt geteld. Je zou dan verwachten dat de stand bij 50% getelde stemmen een betrouwbaar beeld zou geven van 70% of 100%. En een spontane, toevallige swing van + 300.000 voor Trump naar – 70.000 (zoals in Pennsylvania) tart dan alle logica.

Nu weten we echter dat deze vooronderstelling – elke stem is met even grote waarschijnlijkheid voor Trump of Biden; een in eigen persoon uitgebrachte stem in een kleine Republikeinse plattelandsgemeente is representatief voor een per post uitgebrachte stem in een grote Democratische stad – onjuist is. En dat wisten mensen voor 3 november ook al, sterker: het verschijnsel was al weken eerder aangekondigd.
Donald Trump had al maanden poststemmen verdacht gemaakt. Republikeinse kiezers, vaak wonend in dunner bevolkte streken, gingen daarom op 3 november in eigen persoon hun stem uitbrengen en deze stemmen waren vaak snel na het sluiten van de stembus geteld. Dit bezorgde Trump een vroege voorsprong in alle staten. Democratische kiezers stemden wel per post; bovendien wonen zij in grote steden waar het langer duurt de massale aantallen biljetten te tellen. Die stemmen werden dus pas langzaam, in de verkiezingsnacht en de daaropvolgende dagen, verwerkt – en dit veroorzaakte in zes ‘spannende’ staten (behalve de bovenstaande ook in Nevada en Arizona) de verwachte omslag voor Biden, de blue shift (van Republikeins rood naar Democratisch blauw) die analisten al maanden hadden voorspeld.

Samengevat: er was dus wel een patroon, daar hadden het Texaanse OM en alle Republikeinen gelijk in. Het was echter geen patroon van fraude, maar een logische groepering van kiezers en hun stembiljetten die deze keer (vanwege alle poststemmen) zichtbaar werd in het telproces. En dat kwam weer omdat Republikeinse verantwoordelijken geweigerd hadden poststemmen al voor 3 november te tellen, op het moment dat ze binnenkwamen. Waar dat wel was gebeurd (Ohio, Florida) kwam de uitslag in een keer door en was er geen blue shift.

Tweede golf zonder oorzaak
Een tweede voorbeeld van het krampachtig zoeken naar een patroon zagen we afgelopen dagen in ons eigen land, waar de coronacijfers na een novemberdip weer begonnen te stijgen. Krampachtig zochten deskundigen naar een verklaring: open scholen, meer testen, Black Friday-drukte, preventief testen voor Sinterklaas?

De drang om de stijging aan liefst een enkele oorzaak te wijten is verklaarbaar: stel dat we die ene oorzaak zouden kunnen aanwijzen, dan hoefden we alleen maar dat causale verband door te snijden om de tweede virusgolf te breken.
Logisch ook dat de zeventien miljoen Nederlandse virologen geen moeite hebben om ‘schuldigen’ voor de nieuwe lockdown aan te wijzen, zoals deze brievenschrijver in de Volkskrant:

Lockdown
Nogmaals ‘hartelijk dank’ aan alle coronarelschoppers en -ontkenners, alle shopverslaafden in de overvolle straten, massabezoekers bij tuinbedrijven en klusmarkten. Dank aan zingende kerkgangers en clandestiene feesthoppers, dank aan iedereen die geen afstand houdt, het mondmasker niet of verkeerd gebruikt, zijn handen niet wast.

Adri Vinken, Amsterdam

Intussen moeten we open staan voor het idee dat er geen verklaring is voor de coronagolf en dat het een optelsom van ontelbaar veel kleine toevalligheden is.:

In de cijfers zijn een paar argumenten voor deze verklaring te vinden: de besmettingen concentreren zich niet op één specifieke groep. Er is een toename te zien door het hele land, in steden en kleine dorpen. En ook groeit het aantal besmettingen in alle leeftijdsgroepen – weliswaar het hardst onder tieners en jongvolwassenen, maar ook onder 65-plussers is nu een duidelijke stijging te zien. (NRC 12-12-20)

Uit een ander NRC-artikel bleek dat de meeste mensen besmet worden in de thuissituatie, teriwjl ze zich naar eigen zeggen aan de regels hielden.

Misschien moet de nuchtere conclusie dan ook wel luiden: het virus verspreidt zich langs duizenden wegen en we kunnen die sluiproutes niet allemaal afsluiten. Uiteindelijk is een pandemie een stochastisch proces, dat wil zeggen dat het grotendeels toevallig verloopt en dat we niet op causaal niveau kunnen ingrijpen. Met andere woorden: er is niet een enkel bruggetje dat we kunnen opblazen om de vijand van ons vandaan te houden.

Stochastische processen vallen maar tot op zekere hoogte te sturen: of en hoe een rivier van de Zwitserse alpen naar de Noordzee stroomt is een zaak van ontelbaar veel invloeden – waarvan er vele onzichtbaar zijn. We kunnen die rivier dan wel op een paar punten kanaliseren of verleggen, maar dat gletsjerwater van hoog naar laag gaat, daar helpt geen lieve moeder aan – en een radicale poging om die afvoer helemaal buiten Nederland om te leiden zal onvermijdelijk falen (of tot een ecologische ramp leiden).

Om zaken als een pandemie te begrijpen – en het proces enigszins bij te sturen, als dat uberhaupt mogelijk is, moeten we veel beter worden in statistisch denken en moet dat statistische denken veel wijder verspreid raken – niet alleen onder wiskundigen en andere wetenschappers, maar onder politici, ambtenaren, ondernemers, kunstenaars, communicatieadviseurs, journalisten, ja eigenlijk onder alle lagen van de bevolking.

Hoe dat te doen? Daarover een volgende keer meer!