Chi-kwadraattoets

Uit De Vliegende Brigade
Ga naar: navigatie, zoeken

De chi-kwadraattoets (chi square test) is een toets om het verschil tussen twee populaties te kwantificeren. Het wordt oa. gebruikt om te bepalen of een subset voldoende representatief is voor de set als geheel.

Het resulterende getal, X^2, is een maat voor de afwijking of afstand tussen de twee sets. Deze is de som van de kwadraten van de relatieve afwijkingen, oftewel de som van de kwadraten van de genormaliseerde afwijkingen. Het doet me denken aan de kleinste kwadratenmethode.

Formule:

          (f-e)^2
x^2 = sum -------
             e

met e de verwachte of gemiddelde en f de waargenomen frequenties.

Indien X^2=0, dan zijn de twee populaties identiek. Hoe groter de waarde van X^2, hoe groter de populaties van elkaar afwijken.

De chi-kwadraattoets meet welliswaar de afwijking, maar doet geen uitspraak over de statistische significantie van de afwijking. Daarvoor kun je vervolgens terecht bij oa. de p-waarde (overschrijdingskans).

Voorbeeld: Zuivere dobbelsteen?

We gooien 60 keer met een dobbelsteen om te testen of deze zuiver is:

i   |  1  2  3  4  5  6  n
n_i | 13  9  8 11  5 14 60

met i het aantal ogen, n_i het aantal keer dat ogenaantal i is gegooid en n het aantal worpen (=60).

De nulhypothese, H_0 is, dat de dobbelsteen zuiver is. Dus dat alle ogen ongeveer 10 keer worden gegooid.

De formule wordt:

          (f-e)^2
x^2 = sum ------- =
             e

      (13-10)^2 + (9-10)^2 + (8-10)^2 + (11-10)^2 + (5-10)^2 + (14-10)^2
    = ------------------------------------------------------------------
                                      10

       3^2 + 1^2 + 2^2 + 1^2 + 5^2 + 4^2
    =  ---------------------------------
                      10

    = (9 + 1 + 4 + 1 + 25 + 16)/10 = 56/10 = 5,6

Bronnen