P-värdet handlar om slump – inte om klinisk effekt
P-värdet handlar om slump – inte om klinisk effekt
I en klinisk studie har vi undersökt om ett nytt läkemedel kan lindra symptomen vid behandling av en sjukdom, till exempel depression. Resultaten visar att patienterna som fick det nya läkemedlet har en lägre depressionspoäng på en skala än de som fick placebo. Men detta är inte tillräckligt för att dra slutsatsen att det nya läkemedlet har effekt. Varför? När det gäller patienterna i den kliniska studien är det tydligt att de som fick aktiv behandling har lägre depressionspoäng. Men, avsikten med studien är ju att göra en bedömning av den sanna skillnaden i effekt, den som vi skulle ha observerat om vi hade behandlat ett oändligt stort antal patienter. Vår kliniska studie är egentligen bara ett litet stickprov av verkligheten och ett verktyg för att kunna dra slutsatser om den sanna effekten av ett nytt läkemedel. Och för att kunna dra dessa slutsatser behöver man göra statistiska tester. Statistiska tester och p-värden är verktyg för att kvantifiera slumpen och hjälpa oss att avgöra om en skillnad i resultaten kan vara slumpartad eller om den ena behandlingen faktiskt är bättre än den andra. Något formellt är p-värde sannolikheten för att observera en så stor, eller större, skillnad i effekt mellan två behandlingar som vi faktiskt observerar, om utgångspunkten är att behandlingarna är likvärdiga. Om sedan sannolikheten för en sådan skillnad blir orimligt liten, till exempel mindre än 5 procent (p<0,05), handlar det troligen om en verklig skillnad i effekt. Ett p-värde säger alltså inget om hur stor eller kliniskt viktig den observerade effekten är – bara om det är sannolikt att den kan ha uppkommit genom en slump.