Column door Gerrit Stemerdink

Theorie én data

STAtOR

Gerrit Stemerdink – Column

Soms kom je iets tegen waarvan je denkt ‘Hoe verzinnen ze het?’. Onlangs had Arjen Lubach zijn uitzending gewijd aan de geluidsproblemen bij de groei van Schiphol en de uitbreiding van Lelystad Airport. Een deskundige werd getoond die in volle ernst uitlegde dat men met modellen werkte, want als men van metingen uit zou gaan zou de te verwachten geluidoverlast significant hoger zijn.* Hopelijk is het fragment dat werd getoond deel van een uitgebreider verhaal met meer nuance, ik kan me namelijk niet voorstellen dat een exacte wetenschapper een dergelijke uitspraak zonder meer doet.

Kennelijk klopten de data niet bij de modellen, dat is niet zo vreemd, dat komt vaker voor. Als de data correct zijn zit er dan niets anders op dan het model aan te passen. In feite is deze procedure de motor achter de ontwikkelingen in bijvoorbeeld de natuurkunde. Met de mechanica van Newton konden we prima uit de voeten, onder andere planeetbanen konden met grote precisie worden berekend. Maar naarmate de metingen nauwkeuriger werden kwamen er afwijkingen met de theorie tevoorschijn. Zo week de precessie van het perihelion van Mercurius miniem af van dat wat door Newtons mechanica werd voorspeld. Het is een van de eerste zaken die Einstein berekende in zijn algemene relativiteitstheorie: deze bleek wél exact de waargenomen waarde van de precessie te voorspellen.

Ook in ons vakgebied hebben we vaak te maken met modellen, we proberen bijvoorbeeld de variantie in een afhankelijke variabele op te splitsen in de varianties veroorzaakt door enkele verklarende variabelen en hun interacties. Het restant wordt dan traditioneel aangeduid met error. Ik heb altijd een aversie gehad tegen die term error in een model. Liever spreek ik van ‘niet door het model verklaarde variantie’. Dat geeft volgens mij beter weer dat een model niet meer is dan slechts een model en dat de werkelijkheid groter kan zijn. De term error hoort wat mij betreft gereserveerd te blijven voor zaken als meetfouten etc. en zelfs die kun je als deel van het model zien.

Theorie en data kun je niet los van elkaar zien is mijn vaste overtuiging. Data gebruik je om theoretische modellen te toetsen en daarna eventueel aan te passen en uit de theorie wordt duidelijk welke data je zou moeten meten. Onlangs vond ik bij toeval (tja, je bent statisticus of niet) een prachtig onder woorden gebrachte uitspraak met dezelfde strekking.

Sinds mijn gedwongen vervroegde pensionering in 1994 werk ik een dag per week als vrijwilliger bij het Permanent Office van het International Statistical Institute (ISI) in Den Haag. Ik doe daar allerlei klussen waar men met de normale bemensing niet aan toe komt. Zo kreeg ik een verzoek vanuit Singapore om een kopie van een lezing die was gepresenteerd op het tweejaarlijkse ISI congres in Parijs in 1961. Het 19 pagina’s tellende artikel ‘Multiple Classifications in Social Accounting’ was van Sir Richard Stone (1913-1991) die in 1984 de Nobelprijs voor Economie kreeg. Nu ben ik altijd nieuwsgierig, volgens mijn schoonmoeder lees ik álles, zelfs ‘de puntzak van De Gruyter’. Dus ook dit artikel heb ik grotendeels gelezen en daarin kwam ik de volgende eindconclusie tegen waar ik het van harte mee eens ben.

‘[…] All of this goes to show that it is very difficult to separate facts and theories. Those who insist on being guided by facts alone may find that they get very little guidance and those who insist on the distinctions of pure theory may confine themselves to a world which most of their fellow men consider uninteresting.’

* Voor Zondag met Lubach zie YouTube.