Konfidensintervall (II)

Info, referenser, m.m...

Konfidensintervall för medelvärdet (II)

Sannolikhetsfördelning

Konfidensintervall

μ:

σ:

+/-

röda intervall

μ-parameter

σ-parameter

Stickprovsstorlek

Antal stickprov

Grundläggande om konfidensintervall

En vanlig beskrivning i litteraturen är följande: "Ett konfidensintervall är ett numeriskt intervall som med en viss angiven konfidens omfattar det sanna värdet på parametern".
Konfidensintervallet beräknas med hjälp av en given datamängd; typiska parametrar i en fördelning är väntevärde, standardavvikelse, median men kan också vara andra percentiler. (Man kan ibland vilja skatta 5-percentil i en fördelning - det värde på X-axeln som delar utfallet i 5%/95%. Med hjälp av data kan man beräkna en punktskattning av percentilen ifråga och dessutom ett konfidensintervall runt denna skattning.)
Man kan också beräkna ett konfidensintervall för t.ex. parametrarna ('beta-värdena') i en regressionsmodell.

I dessa simuleringar visas bara dubbelsidiga konfidensintervall men man är ibland intresserad av enkelsidiga intervall, t.ex. då man skattar en felkvot är man oftast endast intresserad av en övre gräns. I mer komplicerade situationer kan man beräkna en konfidensregion som då är en (konfidens)yta som med en viss sannolikhet samtidigt omfattar två parameterar (t.ex. väntevärde och standardavvikelse).

Konfidensnivå. Konfidensnivån är sannolikheten att ett intervall träffar /omfattar /omfamnar /innefattar parameterns (okända) värde. Observera att det är fel att påstå att "parametern ligger med 95%-sannolikheten mellan 48.5 och 52.3". I stället kan man göra ett något mer modest påstående: "jag har en beräkningsmetod som beräknar ett intervall som vid upprepade mätningar förväntas träffa rätt (dvs omfatta det rätta värdet på parametern) i 95% av fallen".

Konfidensintervall och hypotestest. Konfidensintervall och hypotestest hänger intimt ihop. Man kan säga att ett konfidensintervall omfattar alla de numeriska värden på hypotesen som man inte kan förkasta. Antag att ett beräknat konfidensintervall är 48.5 – 52.3. Man kan då säga att "jag förkastar alla värden på hypotesen som är < 48.5 och alla värden på hypotesen som är > 52.3, men inte värdena mellan 48.5 och 52.3".
Konfidensintervallets längd kan minskas på fler sätt. Det vanligaste är ju att öka stickprovsstorleken men man kan ibland åstadkomma samma sak med en bättre eller smartare uppläggning av studien.

Ärligare redovisning. Att redovisa ett konfidensintervall — istället för en punktskattning — kan anses vara ärligare. I massmedier älskar man punktskattningar och beskriver mängder av procentsatser. Ytterst sällan anger man ett konfidensintervall eller annan indikation om statistisk osäkerhet. (Enda undantaget är diskussioner i samband opinonsundersökningar om politisk hemvist då man säga något om 'felmarginalen'.)
Kanske det kan bero på att ett konfidensintervall för en procentsats tenderar att bli obehagligt långt om antal observationer inte är stort? Bättre då att endast redovisa en punktskattning...

••••

Några grundläggande övningar på normalfördelningen

Övning 1 – ändra de fyra sliderna
Flytta de fyra sliderna och notera att diagrammen förändras som förväntat. Sliderna kan också flyttas med vänter/högerpil på tangentbordet.

Övning 2 – ändra konfidensnivån till 0.50
Klicka på 0.50 för att välja den lägsta konfidensnivån. Öka antal intervall och notera att ungefär hälften av alla intervall inte träffar parameterns sanna värde. Klicka på 'Repetera' för att göra upprepade simuleringar. Ju lägre konfidensnivå desto kortare intervall men också större risk för att ett intervall missar det sanna värdet. En statistisk redovisning, med konfidensnivå 0.50, är naturligtvis av föga värde.
Notera också att antal röda intervall har en relativt stor variation. Detta beror ju på att en binomialfördelad variabel har störst variation då proportionen är 0.50.

Övning 3 – ändra konfidensnivån till 0.95
Ändra konfidensnivån till 0.95 och 'Antal stickprov' till 100. Gör upprepade simuleringar med 'Repetera'-knappen och notera att antal röda intervall är omkring 5 och med en mindre variation jämfört med övning 2.

Övning 4 – ändra konfidensnivån till 0.99
Ändra konfidensnivån till 0.99 och 'Antal stickprov' till 100 och 'Stickprovstorlek' till ett lågt värde, t.ex. 5. Gör upprepade simuleringar med 'Repetera'-knappen och notera att antal röda intervall är omkring 1 och med liten variation. Notera också att många intervall tycks nå utanför diagrammets grå bakgrund. Öka värdet i "+/-"-fältet och använd 'Repetera'-knappen igen. (Möjligtvis måste "+/-"-fältet ökas ytterligare för att få alla intervall inom diagrammets begränsningar.)

••••

Något om konfidensintervall-diagrammet

Diagrammet innehåller en grå lodrät linje som är fördelningens väntevärde. Denna linje ligger alltid i mitten på diagrammet. Väntevärdet visas i rött längst ned i diagrammet.
Varje vågrät linje är ett konfidensintervall för väntevärdet, baserad på den simulerade datamängden. Om intervallet inte omfattar väntevärdet, ritas det i rött. I mitten på intervallet finns en markering för det beräknade medelvärdet.
Det nedersta intervallet ritas också i normalfördelningen på två ställen.

"+/-"-fältet. Längst ned finns ett fält markerat med '+/-'. Om de simulerade intervallen är långa och når utanför det grå området, kan man ändra skalan för intervallen. Ett ökat '+/-'-värde gör att långa intervall bättre får plats (vid en ändring av skalan rensas de simulerade intervallen).

Antal röda intervall. Längst ned till höger anges antal röda intervall, dvs intervall som missar parameterns sanna värde. Observera att detta antal är en observation av en binomialfördelad variabel: 'felkvoten' är 1-konfidensnivån och 'stickprovet' är antal simulerade stickprov.

••••

Något om sannolikhetsfördelning-diagrammet

Diagrammet visar en normalfördelning med givet väntevärde och standardavvikelse. Väntevärdet visas med en kort röd linje på X-axeln. Standardavvikelsen anges med små korta röda skalstreck.

De röda markeringarna under fördelningen anger de enskilda, simulerade värdena i den sist simulerade datamängden. Dessutom anges motsvarande konfidensintervall (samma som det nedersta i det högra diagrammet).

••••

Info om in/utdata

Slider.  Det finns fyra olika slider – väntevärde, standardavvikelse, stickprovsstorlek och antal stickprov.
Väntevärdet och standardavvikelsen skrivs ut i rött till vänster på sidan. Då värdet på någon av sliderna ändras sker en simulering.
Observera att sliderna också kan ändras med hjälp av vänster/högerpil på tangentbordet. (Det går inte att ändra max eller min på skalorna.)

Konfidensnivå.  Det finns tre konfidensnivåer att välja bland – 0.50, 0.95 och 0.99. Man väljer nivå med respektive tryckknapp.

Repetera.  Man kan repetera en simulering med de aktuella parameterinställningarna genom knappen längst ned till vänster.

••••

Vad är ett konfidensintervall? (Se också knappen [Vad är...?] till vänster.)

Allmänt. Det är ganska lätt att acceptera tanken på och användningen av medelvärde, procentsatser eller andra uppgifter och det är i allmänhet lätt att förstå hur beräkningarna sker. Ibland kan själva tolkningen av ett beräknat värde ställa till problem eller missuppfattas och kanske dölja viktiga saker, t.ex. att datavärden innehåller stor variation.

Men antag att vi tar nya mätvärden, t.ex. mäter ett blodtryck igen eller på andra människor i samma population och beräknar medelvärdet. Antagligen får vi en annan siffra på medelvärdet. Vi misstänker att det är variationen i populationen som skapar detta, hur kan vi resonera?

Intervall. I stället för att upprepa mätningarna många gånger (svårt, opraktiskt eller dyrt) använder vi den första datamängden och beräknar ett numeriskt intervall som vi sedan påstår kommer att med en viss sannolikhet omfatta det sanna värdet på medelvärdet.
Observera att vi pratar om ett intervall för medelvärdet, inte enskilda mätvärden. Vi visar inte här hur beräkningarna sker, det finns beskrivet i många läroböcker.

('sant medelvärde': antag att vi kastar en helt vanlig tärning. Rent teoretiskt kan vi beräkna 'sant medelvärde', som blir 3.5. Om vi däremot kastar en tärning och beräknar medelvärdet så får vi värden som varierar runt 3.5. Men i vanliga praktiska situationer kan vi i allmänhet inte i förväg beräkna sant medelvärde utan är hänvisade till att göra mätningar.)

••••