Fem krav

library(ggplot2)
library("tidyverse")                              # Load tidyverse packages
library("dplyr")

X  <- rnorm(n, 0, 1)
Y  <- rnorm(n, 0, 1)
X3 <- korr*X + sqrt(1 - korr*korr)*Y

K1varden <- myK1 + sigmaK1*X
K2varden <- myK2 + sigmaK2*X3

fx1 <- function(x) {dnorm(x, myK1, sigmaK1)}
fx2 <- function(x) {dnorm(x, myK2, sigmaK2)}

ymax <- max(dnorm(myK1, myK1, sigmaK1), dnorm(myK2, myK2, sigmaK2))

granser <- data.frame(lage=c(tolintK1, tolintK2))

ggplot(granser, aes(x = lage, y=0)) + geom_point(shape=17, size=4, color=c("red", "red", "blue", "blue")) + xlab("X") + ylab("") + 
stat_function(fun = fx1, colour="red") + ylim(0, ymax*1.1) + 
stat_function(fun = fx2, colour="blue") + theme(legend.position="none") + xlim(XYaxel) + 
 annotate("text", x = myK1, y = Inf, label="Kraft 1 (K1)", vjust = 1.5,  hjust = 1.5, size = 6.5, colour = "red" ) + 
 annotate("text", x = myK1, y = Inf, label="Kraft 2 (K2)", vjust = 1.5,  hjust = 0.3, size = 6.5, colour = "blue" )

allaData <- data.frame(K1varden, K2varden)
farg <- c()

farg <- if_else(K2varden < tolintK2[1] | K2varden > tolintK2[2] | K1varden < tolintK1[1] | K1varden > tolintK1[2] | K2varden < konstant*K1varden, 0, 1)

punktfarg <- if_else(farg == 1, 1, 2)

felkvot <- (n - sum(farg))/n
felkvot <- felkvot %>% round(3) 
proptext <- paste(c("   'ej OK' (%): ", felkvot), collapse="")

diagram <- ggplot(allaData, aes(x = K1varden, y = K2varden)) + geom_point(colour = punktfarg) 
diagram <- diagram + geom_vline(xintercept=tolintK1, color="red") + geom_hline(yintercept=tolintK2, color="blue")
diagram <- diagram + geom_abline(intercept=0, slope=konstant) + ylim(XYaxel) + xlim(XYaxel) #+ theme(axis.title.x = element_text("K1", color="red", size=14, face="bold"))
diagram <- diagram + coord_fixed() + theme(legend.position="none")
diagram <- diagram + annotate("text", x = myK1, y = Inf, label=" Fem krav", vjust = 1.5,  hjust = 0.5, size = 6.5, colour = "blue" )
diagram <- diagram + annotate("text", x = -Inf, y = Inf, label=proptext, vjust = 2.5, hjust = 0, size = 4.5, colour = "red" ) + xlab("K1") + ylab("K2")
diagram  + theme(axis.title.x = element_text(color="red", size=14, face="bold"), axis.title.y = element_text(color="blue", size=14, face="bold"))

Visa/dölj bivariat plottning

Visa/dölj parametrar

Visa/dölj programkod för R

Visa/dölj kommentarer

Info, referenser, m.m...

24. Två mätvariabler – fem krav

Att omformulera ett problem till statistisk jargong

Kraft 1 (K1)

Kraft 2 (K2)

Väntevärde (K1)

Väntevärde (K2)

Standardavvikelse (K1)

Standardavvikelse (K2)

K2 > c * K1

Antal simulerade värden

Toleransintervall (K1)

Toleransintervall (K2)

Korrelationskoefficient

X-axelns ändpunkter

Simuleringen illustrerar ett ganska enkelt exempel som består av två variabler K1 och K2 på en och samma produkt. Problemet är snarast att översätta beskrivningen till något som kan hanteras med statistisk metodik.

Antag att man observerar två variabler på varje detalj och att det finns tvåsidiga toleranser för bägge variablerna. Antag att det dessutom finns ett krav att på varje detalj måste den ena variabelns värde vara minst X% högre än den andra variabelns värde. Situationen är nu inte enbart två oberoende variabler utan vi har nu en bivariat situation.

Själva produkten innehåller en vätska och har två svetsade sömmar. Då produkten utsätts för tryck skall en på förhand bestämde söm brista. (Om andra sömmen brister uppstår komplikationer.) Mer information...

Visa/dölj bivariat plottning: det bivariata diagrammet kan döljas eller visas. Det kan också stängas med dialogrutans vanliga kryss.

Visa/dölj parametrar: dialogrutan med slider för parametervärden kan döljas eller visas men kan också stängas med dialogrutans vanliga kryss.

[Repetera simulering]: ett klick på knappen gör en ny simulering med de inställda parametervärdena.

[Kommentarer och övn]: visar ett antal kommentarer och övningar.

••••

Sliderna anger parametervärdena för simuleringen. En ny simulering sker vid varje förflyttning av någon slid. De tre översta sliderna hänger ihop med respektive normalfördelning.

Väntevärde: Anger respektive fördelnings teoretiska medelvärde.

Standardavvikelse: Anger standardavvikelsen för respektive fördelning.

Toleransintervall: Anger det toleransintervall som hänger ihop med respektive mätresultat.

K2 > c * K1: Utöver ett vanligt toleransintervall har konstruktören av produkten också satt att 'Kraft 2' skall vara större än en viss konstant 'c' gånger 'Kraft 2'. (Denna konstant (c) bör ju vara större än 1.)

Antal simulerade värden: Ger antal produkter som simuleras. Det större antalet ger en bättre skattning av andelen utanför tolerans.

Korrelationskoefficient: Gör det möjligt att illustrera en viss korrelation mellan variablerna K2 och K1 (en korrelationskoefficient har intervallet [-1, 1]). (Det kan ju vara så att tillverkningsprocessen inducerar en viss korrelation.)

X-axelns ändpunkter: Gör det möjligt att ändra axlarnas intervall i bägge diagrammen.

••••

Sannolikhetsfördelning för variabel 'Kraft 1' (röd) och för variabel 'Kraft 2' (blå).

Variationen i de två variablerna illustreras här med två normalfördelningar men bör naturligtvis jämföras med befintlig data.
Initialt visas de två fördelningarna med olika spridning. Den blå har något större standardavvikelse och blir sålunda något lägre eftersom bägge har ytan 1.

Med hjälp av sliderna kan fördelningarnas parametrar ändras. Även toleransområdena kan ändras med sliderna.

••••

Diagrammet visar den bivariata normalfördelningen för K2 och K1.

I vänsterkant (övre och under hörnet) visar ändpunkterna för Y-axeln. Samma gäller för X-axeln och värdena ändras med sliden i parameterfönstret.
Toleranserna för respektive variabel är också inritade och märkta med respektive värde. Toleranserna ändras med hjälp av sliderna i parameterfönstret.
Den 'sneda' linjen är 'räta linjen' K2 = c * K1 som utgår ifrån diagrammets origo (som ligger långt nede till vänster utanför den synliga delen).

Det godkända området begränsar av de fyra toleranslinjerna samt den räta linjen. Alla 'OK'-mätningar visas med en grå fylld cirkel, övriga med en röd fylld cirkel.
Överst till vänster visas "Andel 'ej OK'" vilket skattas med proportionen 'Antal röda' / 'Antal simulerade'.
Genom att föra markören över diagrammet kan punktens position avläsas.

••••

Nedan finns ett antal kommentarer och övningar för att belysa viktiga och centrala delar av teorin och simuleringarna:

Kommentar
De två variablerna K1 och K2 är (univariat) normalfördelade men tillsammans bildar de en s.k. bivariat normalfördelning. För att beräkna sannolikheter (ytor) under en normalfördelning är det i allmänhet lätt att hitta de matematiska verktygen. För att beräkna sannolikheter (volymer) under den bivariata funktionsytan är det däremot svårare. Det kräver oftast lite mer avancerade programpaket. Skattningen av sannolikheter sker därför här med simuleringar.

Övning 1
Sätt väntevärde (K1) till 50 och standardavvikelsen till 5 och ändra toleranserna för K1 och K2 till 40 respektive 60. Gör toleransintervallet för K2 så brett att inga punkter hamnar utanför. Ändra till sist 'c'-konstanten så att den räta linje hamnar 'utanför'. Den teoretiska andelen mätvärden utanför tolerans (andelen röda) förväntas bli 0.045. Klicka upprepade gånger på knappen [Repetera simulering] och se att simuleringen konfirmerar detta värde (Större 'Antal simulerade...' ger en mindre variation i skattningen.)

Övning 2
Sätt bägge väntevärdena till 50 och bägge standardavvikelserna till 5 och ändra toleranserna för K1 till 45 respektive 55 (dvs en standardavvikelse från väntevärdet). Ändra också 'c'-konstanten så att den räta linje hamnar 'utanför'. Den teoretiska andelen mätvärden utanför tolerans för en variabel förväntas bli 0.317 men den sammanlagda andelen utanför blir INTE dubbelt så stor.
Upprepade simuleringar ger skattningen (ungefär) 0.53. Anledningen är att många punkter hamnar utanför bägge toleranserna och kan naturligtvis inte 'räknas två gånger'. För att få en teoretisk siffra måste man använda den bivariata normalfördelningen.

Vi kan ju enkelt räkna exakt i detta fall med formeln

P( A eller B) = P(A) + P(B) – P(A och B)

P(K1 inom toleranser och K2 inom toleranser) = P(K1 inom toleranser) + P(K2 inom toleranser) – P(K1 inom toleranser OCH K2 inom toleranser) = [pga oberoende (korrelation=0)] = P(K1 inom toleranser) + P(K2 inom toleranser) – P(K1 inom toleranser) * P(K2 inom toleranser) = 0.31731 + 0.31731 - 0.31731*0.31731 = 0.53393

Övning 3
Antag att det femte kravet är att K2 skall vara 5% större än K1. Sätt sliden "K2 > c * K1' till 1.05. För att få ett litet utfall utanför tolerans kan väntevärde K1 sättas till 38, väntevärde K2 till 60 samt de två standardavvikelserna till, säg, 4.5. Toleranserna kan vara t.ex. 19 - 58 respektive 40 - 78. X-axelns ändpunkter (sliden nere till höger) kan sättas till t.ex. 15 - 85.
(I det hypotetiska fallet då standardavvikelsen är noll, behövs inte de fem kraven...)

Övning 4
Gör en omstart så att alla parametervärden är i respektive utgångslägen. Andelen utanför tolerans är cirka 3.6% och större delen ligger under den räta linjen. Genom att öka sliden 'Korrelationskoefficienten' i positiv riktning minskar successivt andelen utanför tolerans. Det blir också tydligt att resultatet visar ett långsträckt utfall. (Notera att normalfördelningarnas utseende inte ändrats.)
Det går naturligtvis inte i allmänhet att 'introducera' en korrelation i mätvärdena. Om sliden förs i negativ riktning så ändrar plottbilden också riktning. Om sliden dras till ändpunkterna hamnar alla värden på en rät linje.
(En fullständig genomgång av korrelationskoefficienten samt begreppet 'kovarians' finns i många grundläggande böcker i statistikteori.)

••••