Gauss såg inte bara slumpfel
Carl Friedrich Gauss är mannen, myten och legenden bakom Gausskurvan, eller normalfördelningen, som många av oss i life science har stött på i statistiksammanhang. I boken Theory of the Combination of Observations Least Subject to Errors förklarar han grundligt att det finns två sorters fel (och nu pratar vi om mätfel – både Gauss och jag är ju statistiker). När man fått kläm på koncepten slumpfel och systematiska fel kan man förbättra sina analyser och resultat på ett väldigt användbart sätt.
Dels finns slumpfel. Detta är fel som beror på svagheter i våra mätmetoder och på slumpmässiga, externa faktorer. De mäter omständigheter kring objektet man är intresserad av, men är oberoende av objektet i sig. Sedan finns det systematiska fel. Det är en fundamentalt annan typ av fel, som kan ge konstant påverkan på alla objekt från samma klass, ett fel som följer ett reguljärt mönster.
Inte systemfel men ändå systematiska fel
Blockeffekten per klinik är ett vanligt exempel på systematiska fel inom kliniska studier. Ett läkemedels effekt kan skilja sig systematiskt mellan olika kliniker, trots ett kanontydligt studieprotokoll och trots att själva utförandet av studien gått som på räls. Orsaker kan vara variationer i patienternas sjukdomsgrad eller socioekonomi i olika upptagningsområden, eller skiftande behandlingsrutiner mellan vårdgivare. Jag som statistiker tänker på den här klinikeffekten som en konstant som finns inbakad i den uppmätta behandlingseffekten – en konstant som är lika stor för alla patienter på samma klinik. Patienterna på en annan klinik har i stället en annan konstant som ingår i deras mätvärden, och är lika stor för alla patienter på den kliniken. Förutom klinikfelet har varje patient en individuell avvikelse från den genomsnittliga behandlingseffekten – slumpfelet.
Ett annat exempel på systematiskt fel är patientens individuella mätfel i studier med upprepade mätningar. ”Vaddå?” undrar vän av ordning. ”Varje patients mätfel var ju ett slumpfel!?”
Är du både systematisk och slumpmässig på samma gång?
Gränsdragningen mellan de två typerna av fel är glidande. Gauss exemplifierar med en måttstock som är ojämn – den har ett konstant mätfel just vid ett visst mått (säg vid 23 cm), ett fel som vi kan replikera gång på gång (varje gång vi mäter en 23 cm lång sak). Om vi däremot mäter olika objekt som alla har olika mått kommer felet att framstå som slumpmässigt eftersom det är olika mätfel vid varje mått. Gör vi flera provtagningar på varje patient, som är just vad studier med upprepade mätningar gör, kan vi få in så mycket data att systematik bokstavligen poppar fram i patienternas mätfel som gubben i lådan! Det vi först betraktade som slumpmässiga fel visar sig ha förutsägbara komponenter. Varje fel kan då delas upp i två delar: Dels ett systematiskt fel – en viss patient kanske alltid har ovanligt lågt blodtryck. Och dels ett litet, slumpmässigt fel som varierar från mätning till mätning.