376. Wees voorspelbaar

Posted on Mar 29, 2022 in Featured, Uncategorized

376. Wees voorspelbaar

De afgelopen weken heb ik op deze plek over het begrip ‘strategie’ geschreven. Afkomstig uit de krijgskunst is het concept overgegaan op politieke campagnes en planning in het bedrijfsleven – waar het gebruik helaas een hoog bullshitgehalte bezit. Wanneer we kijken hoe het begrip in een oorlogssituatie gebruikt wordt, is de toestand echter niet veel beter. Strategische denkers beloven veel, maar weten in de fog of war weinig te verwerkelijken.

Cliché nummer 1 in alle strategische aanbevelingen: wees onvoorspelbaar. Laat de tegenspeler gissen naar je volgende actie, naar je motieven, naar je doel. Zorg ervoor dat elke zet verrassend is, maar dat jijzelf nooit verrast wordt door de tegenpartij.

Een strateeg doorziet de vijand volledig terwijl hij zelf ondoorgrondelijk blijft. Zijn handelingen zijn zo onvoorspelbaar dat ze niet kunnen worden begrepen, laat staan voorzien. De filosoof-krijgsheer Sun Tzu zegt het zo:

Wees bijzonder subtiel, zodat je bijna vormloos bent. Wees bijzonder geheimzinnig, zodat je bijna onhoorbaar bent. Zo kun je het lot van je tegenstander bepalen.

Op het eerste gezicht lijkt dit een voor de hand liggend advies, tot je bedenkt wat het in een concrete situatie betekent.
Neem schaken. Zeker kan het een voordeel zijn om je opponent te verrassen met een zet die deze niet zag aankomen – maar alleen als het een sterke zet is, niet als je een blunder begaat. Een zet die je blootstelt aan mat in drie zal de ander zeker verrassen, maar het zal hem niet beletten je weg te vegen.
Met andere woorden: wanneer je de keuze hebt tussen een onverwachte maar slechte zet, en een voorspelbare maar goede – doe dan toch maar de goede.

En er zijn nog wel een paar andere tegenwerpingen bij het advies ‘vormloos’ en onvoorspelbaar te zijn.
Ten eerste: om onvoorspelbaar te zijn moet je kunnen bepalen wat de ander wel of niet kan voorspellen. En wie zegt dat je deze inschatting goed kunt maken?
Ten tweede: hoe weet je wat voor verrassende zet je moet doen? In elk scenario zijn er ontelbare mogelijke acties. Hoe kies je daartussen? Neem je de meest gewaagde? De minst gewaagde? De minst waarschijnlijke (die daardoor aan waarschijnlijkheid wint)? Of misschien wel de meest voorspelbare, ervan uitgaand dat je tegenstander zo’n voorspelbare daad reeds als oninteressant terzijde heeft geschoven?

Kortom: vormloosheid is als advies van zichzelf te vormloos om werkzaam te zijn. Wat ook niet zo raar is, omdat een strategisch advies in alle omstandigheden gebruikt moet kunnen worden. Maar dan wordt het vanzelf zo vaag en abstract dat het op elke gewenste manier kan worden uitgelegd.

Speltheorie
Zijn er dan geen strategische regels die (vrijwel) altijd werken en voldoende concreet zijn om toegepast te worden?
Zeker wel.
Enkele van dat soort regels zijn ontdekt in de speltheorie, de tak van wetenschap die zich bezighoudt met (winnende) tactieken in conflictsituaties (of in elk geval situaties waarin de deelnemers verschillende belangen hebben).

Speltheoretie werkt met wiskundige berekeningen, maar ook met experimenten – wanneer het aantal mogelijke uitkomsten zo groot is dat je de gevolgen niet meer in een overzichtelijke som kunt uitrekenen, maar de computer over een langere tijd zijn werk moet laten doen, en dan achteraf het resultaat moet analyseren.

Eén van de eerste computerexperimenten van deze aard vond ongeveer veertig jaar geleden plaats, toen politicoloog Robert Axelrod een toernooi tussen verschillende strategieën (feitelijk computerprogramma’s) in het Herhaalde Gevangendilemma (Iterated Prisoner’s Dilemma) organiseerde. In dit toernooi kon iedereen een strategische regel insturen die met elke andere regel een aantal confrontaties aanging, volgens de uitgangspunten van het klassieke Prisoner’s Dilemma.
Je kon dus kiezen voor Cooperate (Samenwerken) en Defect (Verraden/Bedriegen) – of voor een (meer of minder ingewikkelde) combinatie van beide acties. Elke confrontatie zou een bepaalde uitkomst hebben, met een vaste uitbetaling. Dus CC zou beide spelers 3 punten opleveren, DD elk 1 punt, CD of DC de ‘verrader’ 5 punten en de samenwerker 0.
De simpelste strategieën zouden dan zijn ALLC (AltijdSamenwerken) en ALLD (AltijdVerraden). Ingewikkeldere varianten zouden hun ‘keuze’ mede af laten hangen van de geschiedenis, hun inschatting van hun opponent en de kans om weg te komen met een groter of kleiner verraad. Je zou dan kunnen denken aan DOEWATDEANDERDEVORIGEKEERDEEDMAARGOOIEROMDETIENRONDESEENVERRAADDOORHEEN. Of VERRAADNETZOLANGTOTDEANDERJEBESTRAFT.

Het winnende programma, niet alleen van Axelrods eerste maar ook van zijn tweede toernooi, was een uiterst simpel programma genaamd TIT FOR TAT (‘Gelijk Terugbetalen’). De strategie van TFT was: begin in elke ‘ontmoeting’ met C en doe vervolgens wat je opponent bij de vorige ontmoeting gedaan heeft. TFT was in beide krachtmetingen niet alleen het hoogst scorende, maar ook het eenvoudigste programma.

The secret of our success
Axelrod analyseerde de uitkomsten van beide toernooien en concludeerde (in zijn boek The Evolution of Cooperation uit 1984) dat de beste IPD-strategieën de volgende uitgangspunten hadden:

1. Niet jaloers zijn. Je moet bij je omgang met anderen alleen streven naar een zo gunstig mogelijke score voor jezelf, niet voor een hogere score dan de ander. Wanneer je de ander als tegenstander ziet die overwonnen moet worden, gaat dat ten koste van je eigen opbrengst.
2. Wees niet de eerste om te verraden/de samenwerking op te blazen. Het helpt als je ‘fabrieksinstelling’ er eentje van samenwerking is – dat geeft veel meer kans om met andere samenwerkers langdurige, wederzijds profijtelijke relaties op te bouwen. Als je zo’n relatie beschadigt door plotseling, zonder provocatie, de ander te verraden, kost dat op lange termijn meer dan het op korte termijn oplevert.
3. Beantwoord samenwerking met samenwerking, verraad met verraad. Wederzijds handelen is het meest voordelig, je moet niet netjes blijven samenwerken wanneer de ander je nodeloos provoceert. Blijven samenwerken met een ‘verrader’ stelt je bloot aan uitbuiting. Aan de andere kant moet je ook niet wraakzuchtig zijn: wanneer een verrader bij de volgende interactie weer samenwerkt, moet je dat accepteren.
4. Probeer niet te slim te zijn. Wanneer jouw strategie op een ingewikkelde manier van geval tot geval ‘beslist’ of hier samenwerking dan wel verraad de voorkeur verdient, kweek je een reputatie van onbetrouwbaarheid. En daarop zullen andere mensen – uit voorzorg – reageren met verraad. Je kunt beter een simpele en duidelijke strategie hebben die geen ruimte laat voor misverstanden.

Bovenstaande vier vuistregels voor succesvolle strategieën bieden een rationele reden om niet naïef, maar uiteindelijk wel succesvol, samen te werken.
Als je Axelrods regels volgt laat je jezelf niet uitbuiten, maar evenmin staar je jezelf blind op een enkel blijk van verraad. Je mikt bovendien op een zo hoog mogelijke opbrengst, niet op een hogere score dan je tegenstanders. (Het paradoxale gevolg is dan dat je in een optelsom van rechtstreekse confrontaties tegen elke opponent kunt ‘verliezen’, maar dat je eindscore toch hoger is omdat jij met iedereen dor samenwerking punten kunt scoren – en de ‘verraderlijke’ strategieën elkaar onderling ‘vernietigen’.

Bovenstaande conclusies werden bevestigd bij latere toernooien. Hoewel er subtiele verbetringen op TFT werden gevonden, bleven de regels van niet jaloers zijn, beginnen met samenwerken, wederkerig handelen en voorspelbaarheid overeind staan. Voorspelbaarheid dus, niet ‘vormloosheid’.

Natuurlijk is het succes van deze aanbevelingen wel afhankelijk van de omstandigheden. In sommige settings is het profijtelijker om minder vergevingsgezind te zijn, om vaker spontaan te verraden. En dat wisten we natuurlijk al. In een toestand van wetteloosheid (zoals bij de nachtklok-rellen vorig jaar, of in een oorlog) kun je misschien beter zelf verraden dan verraden worden, beter plunderen dan geplunderd worden.

Het is dus ook belangrijk, voor hoge wederzijdse beloningen, om een situatie te scheppen die samenwerking aanmoedigt. En Axelrod ontdekte ook wat voor een dergelijke situatie nodig is – hoe je win-win spelen creëert waarbij conflicten en tegenstellingen beperkt blijven, verraad wordt afgestraft en samenwerking beloond.
Wat zijn die voorwaarden? Hoe krijgen we die vreedzame, op samenwerking gebaseerde maatschappij? Daarover de volgende keer meer!