P-waarde (statistiek)

Uit De Vliegende Brigade
Naar navigatie springen Naar zoeken springen
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

De p-waarde of overschrijdingskans van een gegeven steekproefuitkomst, is de kans dat de nulhypothese en de steekproef overeenkomen (of juist niet overeenkomen - Lees verder!)

Algemene formule

De algemene formulering betreft een conditionele kans (gegeven H_0) dat de toetsingsgrootheid T (gewoon een stochastische variabele) groter of kleiner is dan een gegeven waarde. Zoiets als:


p=P(T=<t | H_0)                    - Linker overschrijdingskans

p=P(T=>t | H_0)                    - Rechter overschrijdingskans

p=2min{ P(T>=t|H_0), P(T=<t|H_0) } - Tweezijdige overschrijdingskans

Taal

Dit begrip kan tegenintuïtief zijn, en de formulering van de uitkomst in taal, speelt daarbij een rol:

  • Hoe lager de p-waarde, hoe kleiner de kans dat de nulhypothese correct is
  • Meestal ben je juist op zoek naar lage p-waardes, omdat je dan zekerheid hebt omtrent verwerping van een nulhypothese
  • Als je bv. een p-waarde hebt van 55%, is er dus 55% kans dat je hypothese klopt. Meestal kun je daar niet zo veel mee (anders dan wachten en meer statistieken verzamelen)
  • Vaak spreekt met van lage p-waardes. Daarbij wordt dus aangegeven dat er een kleine kans is dat de nulhypothese standhoudt

Als in een bepaalde situatie bv. een p-waarde van 2,44% wordt gevonden:

  • "Er is een kans van 2,44% dat de nulhypothese klopt
  • "Er is een kans van 2,44% dat dit normaal is
  • "Er is een kans van 2,44% dat dit conformeert/klopt/overeenkomt
  • "Er is 97,56% kans dat deze advertentie onderpresteert - Er is 2,44% kans dat deze advertentie het net zo goed doet als de andere advertenties.

Voorbeeld: Zuivere zes?

Om te testen of de zes op een dobbelsteen zuiver is, werpen we deze 180 keer. Daarbij werd 20 keer een zes gegooid. Hoe groot is de kans dat deze dobbelsteen daadwerkelijk zuiver is?

Geformaliseerd

  • Het aantal keren zes is de toetsingsgrootheid T
  • Nulhypothese, H_0: De kans op zes is 1/6
  • T is binomiaal verdeeld, want het betreft herhaaldelijk uitvoeren van een bernoulli-experiment
  • Bionomiaalparameters voor T: n=180, k=20 en p=1/6
  • H_0 wordt verworpen wanneer voor T een te kleine waarde wordt gevonden.

Dit is wat we zoeken: De conditionele kans op 20 keer een zes, gegeven H_0:

p=P(T=<20|H_0)

Toetsingsgrootheid T

  • Toetsingsgrootheid T is een stochastische grootheid en had netzogoed X genoemd kunnen worden.
  • We zijn alleen geïnteresseerd in de uitkomst zes. Dat is in beginsel dus een bernoulli-experiment
  • Omdat we dit experiment 180 keer herhalen, is de bijbehorende kansfunctie een binomiale verdeling

Binomale verdeling

Dit gaat gemakkelijk in Calc:

f(k;n;p)=f(20;180;1/6) ⇒ 

=BINOMDIST(20; 180; 1/6;1)

= 2,44%

De laatste parameter (1) in de binomdist-functie geeft aan, dat de integraal van de complete linkerzijde van de kans berekend moet worden. Dus de kans op 20 successen of minder.

Conclusie: Er is slechts 2,44% kans dat de dobbelsteen zuiver is. En dus 97,56% kans dat de dobbelsteen onzuiver is.

Normale benadering

Het wikipedia-artikel P-waarde zegt dat het berekenen van bovengenoemde binomiale berekening te complex is, en dat je daarom beter een normale benadering kunt gebruiken. Dat brengt afrondingsfouten met zich mee.

Ongetwijfeld klopt dat, als je het met pen-en-papier wilt berekenen. Met Calc of Excel is dit echter geen enkel probleem.

Zie ook

Bronnen