Den statistiske sandhed..

Meget kan man sige om statistik, men statistikken viser altid den nøgne sandhed

Ole L. Olesen,

05/12/2009

Meget kan man sige om statistik, men statistikken viser altid den nøgne sandhed. Omvendt findes der jo små løgne, store løgne og så er der statistik.
Begge er interessante udsagn, der stritter i hver sin retning, men som faktisk begge er korrekte.

Vores nuværende samfund og beslutninger overalt er i højere og højere grad styret af statistikker. Alle ekspertundersøgelser er baseret på statistik og sammenligninger af talstørrelser – og vis mig det firma eller den regering, der ikke bevidstløst læner sig op af den ene statistik efter den anden.
Millioner af konsulentkroner og forskertimer bliver formøblet på fine statistikker, der kan hjælpe beslutningstagere med at træffe de rette valg – eller?

Da jeg i mine yngre år læste økonomi, overværede jeg engang en forelæsning af en professor udi statistik – og det blev en voldsom øjenåbner i mit liv. For han beviste faktisk at begge ovenstående sætninger er rigtige på samme tid.
Jeg vil nævne et par af de eksempler, han anvendte, fordi de er så evigtgyldige, når vi diskuterer statistik og statistisk bevisførelse.

Eksempel A
Rigshospitalets fødeafdeling vil gerne have flere bevillinger. Man fremstiller så en graf, der viser antallet af provokerede aborter over tid. En fint opadgående kurve, der er en glimrende illustration til at bede om flere resurser.
Hvis nu Paven eller Kristeligt Dagblad skulle komme på besøg, ville man i stedet lave grafen, så den viste antallet af aborter I FORHOLD TIL antal fødsler. Så ville kurven være pænt nedadgående og en glimrende illustration af at udviklingen går i den ”rigtige” retning.

Moralen med dette eksempel var at vise, at man altid kan udforme en grafisk fremstilling, så den tilgodeser et hvilket som helst behov, og derfor i sig selv er ubrugelig til andet end at foregøgle en påstand.
Men de er fantastisk effektive til at få sin vilje trumfet igennem med.

Eksempel B
Over en tidslinje på 15 år har vi 2 kurver som har næsten simultane udslag. Hver gang den ene kurve stiger, falder den anden – og begge kurver har et dramatisk knæk i samme årstal.
Herefter spørger professoren: ”Hvor mange herinde mener at der findes en logisk sammenhæng mellem faktorerne for disse 2 kurver?”
Et stort antal studerende mener at der må være en afhængighed. Enkelte svarer at det kan man ikke vide, når man ikke kender faktorerne.
I stedet for at svare, stiller Professoren så et meget kættersk spørgsmål: ”Hvis jeg nu som beslutningstager kan påvirke kurve A, kan jeg så forvente at kurve B vil udvikle sig i overensstemmelse hermed?”
Nu bliver der helt stille i salen, bortset fra en enkelt, der igen fremsiger argumentet om at faktorerne først skal være kendte.
Til dette svarer Professoren: ”Hvis du kender faktorerne, vil du så stole på sammenhængen?” Og svaret er det ønskede: ”Ja, hvis det giver en logisk mening.”
Svaret falder igen prompte: ”Du vil altså stole blindt på denne statistik, hvis det giver mening i dit eget hoved?” Der kom intet svar fra auditoriet.

Herefter fik vi baggrundsoplysningerne: Kurve A viste antallet af arbejdsløse kvinder i Jylland og kurve B viste antallet at importerede påhængsvogne i Danmark.
Professoren vendte sig mod auditoriet: ”Kan vi så få flere kvinder i arbejde ved at importere færre påhængsvogne?”
Nej selvfølgelig ikke, for det er jo en irrelevant sammenligning – eller?

Professorens konklusion var soleklar: Kun hvis begge faktorer måles alene imod hinanden i et længerevarende klinisk forsøg uden andre påvirkninger, kan vi nærme os noget, der minder om en bevisførelse – I ALLE ANDRE TILFÆLDE vil denne slags tal sammenligninger kun repræsentere et subjektivt udtryk for egne holdninger.
Og Professoren sluttede forelæsningen med følgende: ”Begge kurver viser et drastisk knæk i 1972 – i pausen kan I så selv fundere over om det mon skyldes Dronningens regeringsjubilæum eller at Danmark kom med i EF det år.
I alle de mange år jeg efterfølgende har arbejdet med økonomi og som konsulent, har denne professors lære gang på gang vist sig at være uhyggelig sand.

I vore dage, hvor millioner af oplysninger af alle slags er blevet datamatiseret, kan hvem som helst køre uendelige mængder af tal op imod hinanden – og så tænker jeg altid på den gamle professor, hver eneste gang jeg i diverse medier hører eller læser om denne eller hin nye undersøgelse, som viser at børn af rødhårede forældre hyppigere for huller i tænderne, eller at mere socialhjælp giver mindre kriminalitet, eller at motion giver højere livskvalitet, eller at passiv rygning er farligt, eller at for megen hårfarve kan nedarve allergi, eller at CO2 påvirker jordens klima, eller at tomater kan tænke, eller at…
Er det mon så resultatet af seriøs forskning eller blot en sammenstilling af nogle talsæt, der tilfældigvis passer sådan sammen, at de kan underbygge en subjektiv påstand..?

Hvorfor bliver vi ved med - gang på gang på gang - at falde på halen overfor den slags letkøbte "beviser", og stædigt holde fast i dem, også selvom det viser sig at de ikke er funderet i reel forskning?
Undertegnede vil ihvertfald til enhver tid være afvisende overfor et hvilken som helst ”bevis”, der måtte udspringe af statistik, medmindre der ligger en dokumenteret fuldstændig klinisk forsøgsrække bag - og det er der desværre ikke ret mange, der har tid til nu om dage.

Kilde: