Van correlatie naar causaliteit

Als het aandeel van CO2 stijgt in de atmosfeer, dan neemt de temperatuur op aarde toe. Het broeikasgas-effect. Omgekeerd kan een hogere temperatuur ook zorgen voor meer CO2-uitstoot. Dat is ook zichtbaar in historische reeksen van CO2 en temperatuur over de afgelopen (pakweg) half miljoen jaren. Dat werpt de vraag op: wat is hier nu de causaliteit?

Het is een beetje een kip- en ei-vraag. Wat veroorzaakt wat? In een recente paper[1] tonen Van Nes e.a.  tamelijk overtuigend aan dat beide grootheden gekoppeld zijn in een ingewikkelde maar stevige onderlinge relatie: die van een dynamisch systeem.

Proberen we de bovenstaande observaties wiskundig te beschrijven, dan is enerzijds de toename van CO2 van de Temperatuur, en v.v. Dus: dCO2/dt = f(T, …)  en dT/dt = g(CO2, ..). Er moet uiteraard ook nog een remmende terugkoppeling zijn, anders stijgen de T en CO2 tot oneindige hoogten. Dus een dynamisch systeem met minimaal drie variabelen.  Als we zo’n systeem als modelmatig uitgangspunt nemen, hoe kunnen we dan laten zien dat T en CO2 variabelen in hetzelfde systeem zijn? Hier komt een ontdekking van de Nederlandse wiskundige Floris Takens te hulp. In 1981 [2] liet hij zien dat uit slechts één variabele de structuur van het hele systeem te reconstrueren valt.  Hier is een voorbeeld nodig, en daarvoor nemen we de (discrete versie van de) Butterfly van Lorenz. Dat is voor wiskundigen het lievelingsvoorbeeld voor dynamische systemen. Het wordt beschreven door een drietal vergelijkingen in X, Y en Z als functies van elkaar en van de tijd. [zie wikipedia]. Op de bovenste rij van deze afbeelding staat in het midden deze butterfly (alleen de X- en Y-coördinaten). Links staat het verloop van de X-coördinaat in de tijd, rechts die van Z.

5-plots

 

Als we alleen X en Z zouden kunnen observeren, dan kunnen we toch een idee krijgen van de vorm van het onderliggende systeem; voor een goed gekozen sprong S in de tijd kunnen we X(t) afzetten tegen [ X(t-S), X(t-2S), X(t-3S), ….], en dat lijkt qua vorm op het origineel. Het is een “schaduw” van het origineel in het licht van X. Hetzelfde kunnen we doen met Z.  Deze schaduwen staan op de tweede rij van dit diagram.

Op dit ogenblik is het verstandig het filmpje te bekijken, dan wordt denk ik veel duidelijker wat hierboven in woorden staat. Let vooral op de onderste twee boxen.

De punten die we in het filmpje door de X- en Z-schaduw zien bewegen, zijn dus eigenlijk projecties van één punt van het oorspronkelijke systeem. In de twee blokjes onderin bewegen ze synchroon, gaat de een langzaam, dan de andere ook, etc. Zijn X en Z waarnemingen, en zouden we willen laten zien dat ze uit hetzelfde systeem komen, dan moeten we een test verzinnen die deze synchrone beweging test. Die test heet Convergent Cross Mapping. Die is in 2012 gemaakt voor een biologisch vraagstuk en hier voor het eerst door Van Nes c.s. toegepast op het klimaat.

De test om de synchrone beweging te testen is heel basaal. Als er een kluitje punten op de X-schaduw bekeken wordt, moeten de bijbehorende punten opde Z-schaduw ook samenklonteren. Ze mogen niet alle kanten uitgewaaierd zijn, want dan is er geen synchrone beweging. En omgekeerd, nemen we een punt op Z met hun naaste buren, dan moet dat  ook weer een klontje vormen op X. En dan lopen we ook nog een stukje van het pad af met X, en moeten de punten op Z goed blijven volgen.

neighbours

Zo wordt met een slim trucje gekeken hoe goed een stukje van de baan van X in Z wordt gevolgd. Dat doen we niet één keer, maar voor elke lengte van dat stukje honderden keren. De baan kiezen we random. Als “goodness of fit” meten we de correlatie tussen de punten op Z en de projectie van X. Hoe langer het te bekijken stukje, hoe beter de correlatie zou moeten zijn. In de volgende plot staan de reeksen uit [1] voor CO2 en Temperatuur (en v.v.) geplot. De lengte van de geteste stukjes loopt van 10 tot 150 punten; d=4 is het aantal punten in de omgeving die steeds wordt bekeken en l=420 is het totaal aantal metingen in resp T en CO2 (elke 1000 jaar). Per lengte worden random 250 stukje geselecteerd, daar nemen we dan de gemiddelden van de correlaties van.

co2-temp

 

 

Elk punt op de rode of blauwe lijn is dus het gemiddelde van 250 correlaties. We zien de correlaties convergeren naar een constante waarde, en, extra mooi, de varianties nemen ook af.  Dit diagram laat duidelijk zien hoe sterk de CO2 en temperatuur onderdeel uitmaken van hetzelfde systeem.

Wordt vervolgd …

– o –

[1] Egbert H. van Nes, Marten Scheffer, Victor Brovkin, Timothy M. Lenton, Hao Ye, Ethan Deyle & George Sugihara (2015).  “Causal feedbacks in climate change”. Nature Climate Change.

[2] F. Takens (1981). “Detecting strange attractors in turbulence”. Lecture Notes in Mathematics. pp. 366–381.

Leave a Reply