illeszkedésvizsgálat

Kiejtés

  • IPA: [ ˈilːɛskɛdeːʃviʒɡaːlɒt]

Főnév

illeszkedésvizsgálat

  1. (matematika, valószínűségszámítás) Az illeszkedésvizsgálat (vagy más néven illeszkedési próba) egy statisztikai eljárás, amelyet arra használnak, hogy megvizsgálják, mennyire jól illeszkednek a megfigyelt adatok egy adott elméleti eloszláshoz. Ez a módszer segít eldönteni, hogy egy adathalmaz követi-e a feltételezett eloszlást, például a normális, binomiális, vagy Poisson-eloszlást.

1. Khi-négyzet illeszkedési próba

Az egyik leggyakrabban használt módszer az illeszkedésvizsgálatra a khi-négyzet illeszkedési próba (Chi-square goodness-of-fit test). Ez a próba azt vizsgálja, hogy a megfigyelt gyakoriságok mennyire térnek el a várt, elméleti gyakoriságoktól.

A próba lépései:

1. Nullhipotézis ( ) és alternatív hipotézis ( ) megfogalmazása: -  : Az adatok egy adott eloszlást követnek (például normális eloszlás). -  : Az adatok nem követik az adott eloszlást.

2. Khi-négyzet statisztika kiszámítása: A khi-négyzet statisztika az eltérés mértéke a megfigyelt ( ) és a várt ( ) gyakoriságok között:

  ahol   az események száma,   a megfigyelt gyakoriság,   pedig a várt gyakoriság.

3. Szabadságfok meghatározása: A szabadságfok ( ) az eloszlásban lévő paraméterek száma, ami általában  , ahol   a lehetséges kimenetelek száma, de ha a paramétereket becsüljük (pl. az átlagot), akkor ezt is figyelembe kell venni.

4. Khi-négyzet eloszlás alapján kritikus érték meghatározása: A próba eredményét összehasonlítjuk egy khi-négyzet eloszlás kritikus értékével. Ha a számított khi-négyzet érték meghaladja ezt, akkor elutasítjuk a nullhipotézist, különben nem.

5. Döntés: - Ha a számított khi-négyzet statisztika nagyobb, mint a táblázatban lévő kritikus érték egy adott szignifikanciaszinten (például 5 - Ha a számított érték kisebb, mint a kritikus érték, akkor nem utasítjuk el a nullhipotézist, azaz az adatok jól illeszkednek az elméleti eloszláshoz.

Példa:

Tegyük fel, hogy egy hatoldalú dobókockát dobunk 60-szor, és a megfigyelt gyakoriságok a következőek:

- 1-es: 8 - 2-es: 10 - 3-as: 9 - 4-es: 12 - 5-ös: 11 - 6-os: 10

Az elméleti eloszlás szerint minden szám ugyanakkora valószínűséggel fordul elő, tehát a várt gyakoriság minden szám esetén:  

A khi-négyzet statisztika így számítható:    

A szabadságfok  , és ha a kritikus érték  -os szignifikanciaszinten 11.07, akkor mivel  , nem utasítjuk el a nullhipotézist, tehát a kockadobás eredményei jól illeszkednek a feltételezett egyenletes eloszláshoz.

2. Illeszkedésvizsgálat más módszerekkel

- Kolmogorov–Smirnov próba: Folytonos eloszlások esetén alkalmazható, és azt vizsgálja, hogy két eloszlás mennyire tér el egymástól (például egy minta eloszlása mennyire tér el egy elméleti eloszlástól). - Shapiro-Wilk teszt: Főleg a normalitás vizsgálatára szolgál, vagyis arra, hogy egy minta követ-e normális eloszlást.

Összegzés:

Az illeszkedésvizsgálat alapvetően arra szolgál, hogy megvizsgálja, mennyire követi egy minta a feltételezett elméleti eloszlást. A legelterjedtebb módszer a khi-négyzet illeszkedési próba, de más eloszlások esetén speciális teszteket is alkalmaznak, például a Kolmogorov–Smirnov tesztet vagy a Shapiro-Wilk tesztet.

Fordítások