Visa/dölj programkod för R

Kommandon för R – grafer m.m.




        

Denna sida beskriver ett antal olika sannolikhetsfördelningar. Då sidan öppnas visas den s.k. Weibullfördelningen.

Andra fördelningar finns under länken 'Välj en fördelning...'.

Rita en fördelning med R – se 'Normalfördelningen'.

Info, referenser, m.m...

Weibullfördelningen

Weibullfördelningen – några egenskaper

Weibullfördelningen är en kontinuerlig fördelning som
ofta används i t.ex. tidsmätningar, livslängdsdata, etc.

Sannolikhetsfördelningen

Fördelningsfunktionen

μ :

σ :

F(x):

x:

skevhet:

typvärde:

median:

a-parameter:

b-parameter:

 Välj en fördelning...

Kontinuerliga fördelningar

  Exponentialfördelning – ett specialfall av Weibullfördelningen då formparametern a = 1. Används ofta för att modellera väntetider.

  Gammafördelning – Gammafördelningen är en kontinuerlig fördelning och nämns ofta då man modellerar livslängder som är summan av ett antal (exponentialfördelade) tider mellan händelser.

  Lognormalfördelning – används ibland som livslängsfördelning med något speciella egenskaper. Har en nära koppling till normalfördelningen.

  Normalfördelning – den vanligaste kontinuerliga fördelningen.

  Rayleighfördelning – ett specialfall av Weibullfördelningen då formparametern a = 2. Används ofta inom radioteknologi vid modellering av dämpning s.k. Rayleigh fading.

  Weibullfördelning – en vanlig fördelning för tider – kötider, livslängder, väntetider, etc. Låga värden på formparametern ger positivt skeva fördelningar medan höga värden ger negativ skevhet.

Diskreta fördelningar

  Binomialfördelning – modellerar antal felaktiga x i ett stickprov om n enheter då processens felkvot är p.

  Geometrisk fördelning – modellerar antal 'OK' mellan varje 'ej OK' om processens felkvot är p.

  Poissonfördelning – modellerar antal händelser i något kontinuum – ett tidsintervall, en yta, en volym, etc.

••••

'Min' måste vara större 0 och mindre än 'Max'!
(dvs 0 < Min < Max)

Ändra i rutorna nedan:

Några vanliga användningsområden


Weibullfördelningen är en synnerligen vanlig kontinuerlig sannolikhetsfördelning och är använd i en mängd olika applikationer. I litteraturen tycks de vanligaste exemplen vara inom livslängdsanalys.
Specialfallet exponentialfördelningen (då a-parametern är 1) dyker upp varhelst man studerar tider eller händelser och ett vanligt exempel i läroböcker är radioaktivt sönderfall.

Allmänt gäller att om händelser inträffar slumpmässigt i tiden och med konstant 'händelseintensitet' (dvs den varierar inte med tiden) så är tidsavstånden mellan händelserna exponentialfördelad (dvs Weibullfördelad). Händelser kan här vara kunder till en butik, felrapporter till ett IT-system, fel på en lackad kabel, etc.

Om a-parametern är 2 kallas fördelningen Rayleighfördelningen som är väldigt vanlig i radiotekniska sammanhang.

••••

Något om parametrar, resultat och diagram


μ:  Fördelningens väntevärde. Anges också i rött på X-axeln under sannolikhetsfördelningen. Väntevärdet beräknas med fördelningens två parametrar, a och b med formeln μ = b*G(1 + 1/a) där G är gammafunktionen.

σ:  Fördelningens standardavvikelse. Anges som röda skalstreck på X-axeln under sannolikhetsfördelningen. Standardavvikelsen beräknas med fördelningens två parametrar, a och b med formeln σ = sqrt[b**2 * G(1 + 2/a) - (b * G(1 + 1/a))**2] där G är gammafunktionen.

F(x):  Den färgade ytan till vänster om den röda vertikala linjen på X-axeln (ytan visas då markören dras över det vänstra diagrammet). F(x)-värdet anger sannolikheten att få ett värde mindre eller lika med x och visas också på den högra grafens Y-axel. F(x) är alltid inom intervallet [0, 1], dvs 0 < F(x) < 1.

x:  x-värdet visas på X-axeln under sannolikhetsfördelningen då markören dras över det vänstra diagrammet. x-värdet visas också på det högra diagrammets X-axel.

a-parameter:  Weibullfördelningen har två parametrar och den ena betecknas ibland med ett a och kallas vanligtvis i litteraturen för formparametern ty den förändrar fördelningens form. Värden runt 1 gör att fördelningen ser ut som en skidbacke, värden runt 3.6 gör fördelningen ungefär symmetrisk och högre värden gör fördelningen negativt skev.
Parametervärdet ändras med hjälp av skjutreglaget och skalan kan ändras genom att klicka på nuvarande värden och skriva in andra. Observera att parameter-värdet alltid är > 0. Det går att använda piltangenterna för att ändra parameterns värde.

b-parameter:  b-parametern kallas i litteraturen för skalparametern ty den förändrar fördelningens utsträckning över X-axeln. Parametervärdet ändras med hjälp av skjutreglaget och skalan kan ändras genom att klicka på nuvarande värden och skriva in andra. Observera att parameter-värdet alltid är > 0. Det går att använda piltangenterna för att ändra parameterns värde.

••••

X-axeln
X-axeln i bägge diagrammen har ett min- och ett max-värde. Dessa kan ändras på sannolikhetsfördelningens X-axel till något värde som kanske bättre passar den uppritade fördelningen. Om något värde ändras så sker automatiskt samma ändring i högra diagrammet. Min- eller max-värdet ändras genom att klicka på nuvarande värden och skriva in andra.

Y-axeln
Y-axeln i sannolikhetsdiagrammet (det vänstra diagrammet) är av ringa intresse och har därför utelämnats. Observera att Y-axeln på sannolikhetsdiagrammet inte visar sannolikhet. Y-axeln i högra diagrammet är dock ett sannolikhetsmått (därav intervallet [0, 1]) och visar värdet av den färgade ytan i sannolikhetsdiagrammet då markören dras över ytan.

Högra diagrammet
Det högra diagrammet kallas vanligen för en fördelningsfunktion och betecknas ofta i datorprogram för cdf (cumulating distribution function). Det finns tre små blå markeringar på Y-axeln, dessa är kvartil 1, 2 och 3, se övningarna!
I datorprogram visas ofta kurvan med transformerade axlarna så att kurvan bildar en rät linje. Detta är praktiskt om mätdata plottas i diagrammet för att avgöra överensstämmelse mellan data och modell.

••••

Några grundläggande övningar


Övning 1 – ändra a-parametern
Dra a-parametern fram och tillbaka och notera att kurvan ändrar form. Väntevärdet, som är 2.27 vid start, ändras bara lite, åtminstone om parametern är något större än 1. De små röda markeringarna på X-axeln är antal standardavvikelser (sigma) från väntevärdet.

Övning 2 – ändra b-parametern
Dra b-parametern fram och tillbaka och notera att kurvan behåller formen men breds ut över X-axeln. Väntevärdet variera kraftigt då b-parametern ändras. Notera att Weibullfördelningen är symmetrisk då b-parameterna är ungefär 3.6.

Övning 3 – ändra X-max
Gör en omstart och klicka på max X-värde och ändra det från 9.0 till 6.0. Notera att plus och minus tre standardavvikelser omfattar praktiskt taget all sannolikhetsyta och att detta gäller oavsett vilka parametervärden som används. Observera att eftersom det inte finns negativa värden (dvs inga värden < 0) i Weibullfördelningen så ritas kanske färre än tre standardavvikelse fram till 0 på X-axeln.

Övning 4 – illustration av sannolikhet
Dra markören över det vänstra diagrammet. Värdet på den färgade ytan, och motsvarande x-värde, visar till vänster som 'F(x)' och 'x'. Dessutom visas resultatet i diagramform till höger i den s.k. fördelningsfunktionen.

Övning 5 – Q1, Q2, Q3
Ibland är man intreserad av kvartilerna dvs de X-värden som delar in fördelningen i bitar om 25%. Kvartil 2 (Q2) kallas också för medianen dvs det X-värde som delar ytan i två lika delar. En Weibullfördelning med parametervärden 2.55 och 2.55 har följande resultat: Q1 = 1.564, Q2 = 2.209, Q3 = 2.899. Dra markören över det vänstra diagrammet och verifiera att dessa värden stämmer i diagrammet till höger.

Övning 6 – ändrad måttenhet
Antag att ett företag mäter livslängd i månader men beslutar att gå över till att ange resultatet i dagar. Hur påverkas parametrarna i fördelningen? Vår erfarenhet säger oss att vi inte borde förvänta några speciella skillnader bara för att ändrar tidsmåttet (här antar vi att en månad motsvarar 30 dagar). I denna övning är a = 2.55 och b = 2.55. Vi förväntar oss att μ borde öka från 2.27 till 30*2.27 = 68.1 och att σ borde bli 30*0.95 = 28.5. (Skillnaderna är avrundningsfel.)
Under Parameterbeskrivning finns en formel som visar att μ ökar direkt proportionellt mot b. Ett nytt b borde alltså vara 30*2.55 = 76.5. Ändra skalan för b-parametern till t.ex. 74 - 78 och dra sedan b-värdet till 76.5. Ändra också X-max i diagrammet till 170 så att hela fördelningen syns. Kontrollera också att Q1, Q2 och Q3 (se övning 5) nu blir 30*1.564 = 46.92, 30*2.209 = 66.27 och 30*2.899 = 86.97.

Övning 7 – väntevärde och median
Observera att väntevärdet är fördelningens tyngdpunkt på talaxeln, medan medianen är det tal på X-axeln som delar fördelningen i exakt två lika delar. (Dagstidningar och andra medier brukar felaktigt blanda ihop t.ex. 'medelvärdeslön' och 'medianlön' eller 'medellivslängd' och 'medianlivslängd', dessa är inte samma sak.)
Ändra a- och b-parametern så att diagrammen visar en skev fördelning. Dra sedan markören över det vänstra diagrammet så att 50% av ytan täcks (dvs 'F(x): 0.500') och notera att det finns en skillnad mellan väntevärde och median. Genom att ändra på parametrarna och X-skalan så går det att få medianen att vara både större och mindre än väntevärdet. Vid höga värden på b-parametern blir fördelningen negativt skev, dvs med en viss utsträckning åt vänster, den negativa riktningen.

••••

Beräkning av my (μ) och sigma (σ):

Generellt för alla fördelningar gäller följande två uttryck:

μ=E( X) σ2=E( X-μ ) 2


För Weibullfördelningen får vi följande:

μ=bΓ( 1 + 1 a ) σ= b2( Γ( 1 + 2a )- Γ( 1 + 1a ) 2 )

••••

a-parametern:

a-parametern kallas ibland för formparameter (shape parameter) eftersom den styr formen på fördelningen. När parametern är ungefär 3.6 blir fördelningen ganska symmetrisk.


b-parametern:

b-parametern kallas ibland för skalparameter (scale parameter) eftersom den styr fördelningens utbredning på X-axeln.

Bägge parametrarna påverkar både väntevärdet (μ) och spridningen (σ), se formel under 'i'-knapp till vänster.

••••