Info, referenser, m.m...

Histogram – övningar

Denna sida innehåller exempel och övningar på histogram, fördelningar, etc.

* Övning 4

*

Antal mätvärden att simulera:

Medelvärde (my):

Standardavvikelse (sigma):

Medelvärde (my):

Standardavvikelse (sigma):

Medelvärde (my):

Standardavvikelse (sigma):

Visa 'fig 1' i Minitab

Visa 'fig 2' i Minitab

Visa 'fig 3' i Minitab

Visa 'fig 4' i Minitab

Varje ruta innehåller parametervärden som används för att simulera data för analys. En ändring registreras direkt i kommandorutan till höger:


Antal mätvärden att simulera: I dessa övningar simuleras ett antal datakolumner som används för att illustrera begreppet 'Histogram' och dess egenskaper. Det blir samma antal data för alla simulerade kolumner.

Medelvärde (my): Medelvärdet för normalfördelade data.

Standardavvikelse (sigma): Standardavvikelsen för normalfördelade data.


Övning 4 använder tre kolumner med data och nedanstående rutor blir då tillgängliga för ytterligare två normalfördelningar:


Medelvärde (my): Medelvärdet för normalfördelade data.

Standardavvikelse (sigma): Standardavvikelsen för normalfördelade data.

Medelvärde (my): Medelvärdet för normalfördelade data.

Standardavvikelse (sigma): Standardavvikelsen för normalfördelade data.

"Visa 'fig 1'...": Minitab-makrot skapar fyra olika grafer och det är inte alltid önskvärt att dessa skapas vid varje övning. Det är sålunda möjligt att förhindra att en eller flera grafer skapas. (Exempel på grafer finns under länkarna "%Hist (fig 1)...".)


Alla förändringar som görs i indatarutorna registreras på sidans 'kommandoruta'. För att skapa data i Minitab måste raden '%HistWeb...' manuellt kopieras in i Minitab och aktiveras. Därefter kan analysen utföras.

Det finns tre knappar som visar övningar och texter (övningar i pdf-format kan skrivas ut och användas). De tre blå länkarna visar exempel på grafer som skapas av %Hist-makrot i Minitab.

••••

Rutan visar en normalfördelning med indata enligt de översta 'Medelvärde' och 'Standardavvikelse'. De sex mindre vertikala linjerna markerar tre standardavvikelser från medelvärdet. (Det går inte att ändra diagrammets X-skala.)

Om även de övriga fälten 'Medelvärde' och 'Standardavvikelse' är ifyllda visas det tre olika normalfördelningar (färgen på texter och linjer korresponderar).

Varje gång något parametervärde ändras uppdateras också informationen i kommandorutan.



••••

'Kopiera/Klistra in' raderna i rutan nedan till 'Session window' i Minitab vid "MTB >"-prompten och tryck sedan på [Enter]-knappen på tangentbordet.

Första två raderna simulerar data för den angivna övningen. Övriga rader är förslag på analys och grafer.

Om värdet ändras i någon av indatarutorna ändras också motsvarande kommando i rutan.



••••

Övning 1 – en första körning
Denna övning simulerar ett antal värden och ritar fyra olika grafer i Minitab. Överför kommandona till Minitab-fönstret och tryck [Enter]. De fyra graferna innehåller förklarande text och ett exempel på varje graf finns under länkarna '%Hist (fig 1)".

Övning 2 – litet antal mätvärden
Denna körning innehåller mycket färre datavärden. I allmänhet blir då histogram ganska svåra att tolka men det s.k. 'probability plot'-diagrammet är lättare att tolka. Medelvärde och standardavvikelse blir ofta nära de angivna parametervärdena.

Övning 3 – stort antal mätvärden
Denna körning innehåller ett stort antal datavärden. I allmänhet blir då histogrammet och 'probability plot'-diagrammet lätta att tolka. Medelvärde och standardavvikelse blir nära de angivnina parametervärdena.

Övning 4 – tre datamängder i en 'probability plot'
Denna körning innehåller tre datamängder och alla tre plottas i samma 'probability'-plot. Grafen innehåller också de tre datamängderna som histogram men det är svårare att jämföra många olika histogram (bl.a. på grund av platsbrist på dataskärmen eller utskriften. Se också övning 6.)

Övning 5 – tre datamängder i ett gemensamt histogram
I denna övning skapas Minitab-kommandon som skapar tre datamängder i samma histogram.

Övning 6 – många datamängder i samma 'probability plot'
Kolumn c21-c30 innehåller simulerat mätresultat vid 10 olika frekvenser i studiet av en högtalare. Alla kolumner plottas i samma 'probability plot' och det är lätt att se att data i två kolumner avviker kraftigt från övriga.


••••

Länkar

Confidence interval for p (ENG)
The animation shows how a confience interval for p should be intepreted. Here p ('proportion', 'fault rate', etc) is the unknown parameter to be estimated from a dataset.

Several distributions with common μ and σ (ENG)
The animation shows several distributions with common μ and σ. By two slides these values can be changed and the corresponding functions visualised.

Simulering av kapabilitetsindex Cpk
Ett kapabilitetsindex är ett index som försöker sammanfatta förhållandet mellan utfallet från en process och dess specifikationer.

A mixture of distributions (ENG)
An animation that shows what happens when distributions are mixed.

Simulating a comparison of two proportions (ENG)
A simulation that shows some of the difficulties when comparing two proportions.

Animering av en enkel OC-kurva
Här animeras en enkel OC-kurva som beskriver vissa egenskaper hos ett enkel stickprovsförfarande.

Simulering av talet pi — Buffons nål
Här simuleras och animeras Buffons nål — ett klassiskt sätt att simulera det berömda talet pi.

Konfidensintervall
Här simuleras och animeras flera grundläggande egenskaper hos ett konfidensintervall.

Ett antal fördelningar
Initialt visas en Weibullfördelning men ett antal kontinuerliga och diskreta fördelningar kan visas via en länk. För varje fördelning kan parametrarna ändras steglöst så att fördelningarnas form och läge uppdateras.

Avverkning av felrapporter
Simuleringen visar hur antal felrapporter minskar då antal 'ut' överstiger antal 'ut' och minskningen sker ungefär som en rät linje. Variationen vid RTL ("Ready To Launch") påverkas kraftigt då 'utintensiteten' förändras.

Kvalitetsbristkostnader
Simulering av en enkel process (utan alternativa flöden) där en enhet kan ha upp till fem olika fel. Det finns tre teststationer där felen kan upptäckas eller passera oupptäckta (den sista teststationen är kunden).

En Markovkedja
Simulering av en enkel s.k. Markovkedja. En sådan beskrivs ofta som en process med flera steg och där ett 'ärende' kan hoppa omkring med kanske inget eller flera slut. En hiss kan ju gå från olika våningar men kommer aldrig fram medan ett bankärende eller felrapport kommer att avslutas förr eller senare.

En Quincunx
En s.k. Quincunx är en enkel apparat där man låter kulor e.d. falla ned mot någon typ av stopp och på så sätt visa hur summan av en mängd små händelser leder till ett normalfördelat utfall.


Minitab-makron

%2000   Makrot plottar 2000 punkter (som tidigare simulerats) och diagrammet visar en kanske oväntad form men helt i linje med statistisk teori. Kräver en viss kunskap om binomialfördelningen.

%Birthday   Makrot simulerar och illustrerar det klassiska födelsedagsproblemet "Hur stor grupp behövs för att hitta minst två personer med samma födelsedag?".

%CLT   Makrot illustrerar den s.k. centrala gränsvärdessatsen (CLT). När ett antal värden summeras (t.ex. ett medelvärde) tenderar utfallet att bli mer normalfördelat då antal termer ökar. Se också %Die.

%CreDist   Makrot skapar en teoretisk diskret sannolikhetsfördelning baserad på användarens indata. Dessutom simuleras data från denna fördelningen.

%Die   En vanlig tärning används ofta för att illustrera statistisk teori. Här visas bl.a. hur fördelningen av en summa av värden snabbt närmar sig en normalfördelning. Se också %CLT.

%DistA   Makrot ger teoretisk info och simulerar 12 olika sannolikhetsfördelningar som kan användas i praktiskt arbete. ('Cachy' är matematiskt extremt avvikande och bör studeras för just dessa egenskaper. Se t.ex. [3])

%DrawPin   Makrot simulerar kastserier där varje resultat har två värden. Den observerade kvoten närmar sig det sanna värdet samtidigt som utfallet (summan) blir mer symmetriskt. Se också %CLT och %Die.

%DxDy   Inom elektronitillverkning är det viktigt att anpassa olika masker mot varandra. Hur görs detta på bästa sätt om varje mask har måttoriktigheter? Makrot gör en matematisk optimering så att de kvarvarande felen blir så små som möjligt (dvs felens varians i X- och Y-led minimeras).

%Hdist   Makrot simulerar det kortaste avståndet mellan två punkter i planet. Exemplet kommer från elektroniktillverkning där punkter för t.ex. komponenter och elektriska ledare skall sammanfalla utan alltför stora avvikelser. Se t.ex. [5], [6], [7].

%Hist   Makrot gör en genomgång av och diskussion om begreppen histogram och sannolikhetsdiagram ('probability plot'). Användaren kan ändra parametervärden, antal, data, etc.

%LinC   Linjärkombinationer uppstår då man sätter ihop detaljer, lägger ihop tider, beräknar medelvärden, etc, alltså då man adderar eller subtraherar mätvärden till en summa. Makrot illustrerar detta med en axeltapp som skall passa i en lagring. Se t.ex. [A good example...] och [Combination of...].

%Merror   Mätfel är alltid ett aktuellt ämne då man studerar data. Vad är sannolikheten att ett uppmätt resultat, utanför givna specifikationer, verkligen är fel? Vad är sannolikheten att ett mätresultat, inom specifikationerna, verkligen är rätt? Naturligtvis kan man inte skilja mellan mätvärdet och det sanna värdet, man kan dock göra upprepade mätningar på t.ex. kända likare och sålunda få ett grepp om felet. Observera att även om mätvariabeln är kontinuerlig så blir ju resultatet av typ 'OK' respektive 'ej OK'.

%MinMax   Ibland är man intresserad av extremvärden: 'hur stark är den svagaste länken i en kedja?' Värden som 'min', 'median', 'max' kallas på engelska för 'Order statistics'. Ett annat exempel: '5 % får understiga 15 mH' är en specifikation om 'order statistics' nämligen 5-percentilen. 'Order statistics' är något extra komplicerat men är värt att studera och känna till. Se t.ex. [Order statistics.doc] och [Fastest scorer.doc].

%Mix   En mixture är en blandning av mätvärden och skall inte förväxlas med en kombination av variabler. En blandning av data är naturligtvis oerhört vanligt. Makrot ger teoretisk info och simulerar hur blandningar kan uppstå. Se t.ex. [57])

%OC   'OC' är en förkortning för 'Operating Characteristic' och används oftast inom stickprovsteori (som ju också är 'beslutsteori', dvs man fattar beslut om t.ex. partier av produkter och där det finns en risk att man fattar fel beslut p.gr.a resultatet i stickprovet.)
Makrot ritar tre olika grafer som är vanliga då man diskuterar OC-kurvor. Observera att makrot bara visar teoretiska resonemang, det finns inga simulerade data eller andra data. 'p' på X-axeln är processens felkvot, inte observerade data.

%PoAcc   Makrot diskuterar Poissondata och ritar en graf med tre olika processer med olika parametervärden. (Dessa kan ändras inför en ny simulering, se detaljer i datafönstret.) I graferna ritas resultatet som ackumulerande, dvs för varje ny händelse så hoppar kurvan ett steg uppåt på Y-axeln. Detta kallas ibland för en 'pure birth process' dvs det finns inga 'deaths'. De tre färgade punkterna längst till höger anger förväntat resultat och graferna kommer att sluta som en slumpmässig variation runt dessa punkter i enlighet med Poisson-fördelningens egenskaper.

%PoisSim   Makrot diskuterar en jämförelse mellan 'medelvärde' och 'median' i en Poissonfördelning. (Upprinnelsen är en IT-avdelning på ett större företag som ville börja redovisa 'median för antal störningar per månad' i stället för medelvärdet.) Det visar sig att medianen är långt mer okänslig mot förändringar i processen, detta ansågs vara bra ty det oroade inte kunderna! En utförlig diskussion: [27])

%Reg   Regressionsanalys är en oerhört viktig analysform. Idén är att söka ett samband mellan ett mätresultat och en eller flera förklarande variabler. Grunderna presenteras i många böcker om statistisk analys och makrot understryker de viktigaste punkterna samt ger möjlighet att simulera samband för bättre förståelse.

%Rounding   Den som använder 'normalitetstest' på data stöter ibland på 'Anderson-Darling'-test. Eftersom riktiga data oftast är begränsade till en, två eller tre decimaler, brukar testet förkasta hypotesen om 'normalitet'. Makrot simulerar data och diskuterar hur testet reagerar på olika avrundningar av data. Se också [79])

%ScrapCost   Antag att vi producerar elektronikkomponenter, t.ex. mönsterkort. Vi börjar då med ett råmaterial, ett ämne, som vi sedan förädlar genom att borra hål för komponenter, etsa fram mönster, skyddslacka ytan, konturbearbeta. Varje sådan operation är inte helt felfri så i slutändan har man antagligen färre produkter än antal ämnen vid start.
Om vi har färre produkter än vi har lovat kunden uppstår kostnader av typ omstartskostnader, förseningskostnader, etc. Om vi i stället har fler produkter tvingas vi kassera eller ge bort dem utan ersättning. Hur skall man eller kan man resonera om det 'överantal' som man bör starta med? Makrot beräknar förväntad kostnad. Se också dokument i 'Statistikhörnan'.

%SimQ   Många praktiska situationer kan beskrivas som köer – personer till betjäningsställen, ansökningar om bygglov, felrapporter i IT-utveckling, testning och omtestning av produkter i en produktionslina etc. Makrot simulerar en sådan enkel kö och ritar ett antal grafer. Köteori bygger ofta på s.k. Markovkedjor eller Markovprocesser och dessa är rikt dokumenterade på nätet och i litteraturen och väl värda uppmärksamhet.

%SimUB   Praktiska situationer blir ibland extra komplicerade och då kan simulering vara ett sätt att få bra svar. Makrot beskriver ett fall där en elektrisk krets består av två resistanser. En matematisk formel används för att beräkna obalansen (UB) i kretsen. I praktiken finns det en viss variation mellan komponenterna innan de löds ihop till en krets och en central fråga är hur denna variation påverkar slutresultatet.
Makrot simulerar data med olika standardavvikelse på resistansen och redovisar sedan vilken andel kretsar som har ett UB-värde som ligger utanför specifikation. Ju mindre variation hos komponenterna desto bättre (och dyrare!) krets.

%Taxi   Makrot diskurerar hur man kan skatta det högsta talet (N) i en serie typ 1, 2, 3, ...N och där man har ett stickprov från serien. Makrot redovisar två skattningsmetoder med förbluffande olika precision.

%Timing   Makrot är populärt ty det simulerar mer och mer data i ett antal kolumner och mäter tiden och ger sålunde info om prestanda hos datorn (brukar ge upphov till jämförelser och diskussioner). Resultatet presenteras som en regressionsanalys (se %Reg) med två förklarande variabler.

%TwoNo   Makrot simulerar en relativt enkel situation med två mått på samma enhet men där det är viktigt att rätt formulera frågan som skall besvaras. Se t.ex. [2])

%W   Makrot ritar och simulerar fyra olika Weibullfördelningar givet parametervärden som anges i datafönstret.

%XbarS   Makrot sammanfattar ett antal punkter om medelvärde och standardavvikelse samt simulerar värden som presenteras i några grafer. Datafönstret innehåller ett antal övningar.

Några dokument

Några erfarenheter
Några erfarenheter med att arbeta med data.

Ett antal dokument
Mer än 25 olika dokument om varierande område inom statistik och statistisk analys. Se t.ex. "What is sigma?" som har en noggrann genom av vad sigma är, hur sigma skall tolkas, hur sigma kan beräknas, etc.



••••