normalitásvizsgálat

Kiejtés

  • IPA: [ ˈnormɒlitaːʃviʒɡaːlɒt]

Főnév

normalitásvizsgálat

  1. (matematika, valószínűségszámítás) A normalitásvizsgálat egy statisztikai eljárás, amelynek célja annak megállapítása, hogy egy adott adathalmaz normál eloszlású-e vagy sem. A normális eloszlás, amelyet Gauss-eloszlásnak is neveznek, széles körben használt a statisztikában, és számos statisztikai módszer alapjául szolgál.

Miért fontos a normalitásvizsgálat?

1. Statikus tesztek érvényessége: Sok statisztikai teszt (pl. t-teszt, ANOVA) feltételezi, hogy az adatok normál eloszlásúak. Ha ez a feltétel nem teljesül, a tesztek eredményei torzulhatnak.

2. Adatmodellálás: A normális eloszlás alapját képezi a regressziós modellek és a különböző predikciós modellek kialakításának.

Normalitásvizsgálati módszerek

1. Grafikus módszerek: - Histogram: Az adatok eloszlásának vizuális bemutatása, amely lehetővé teszi, hogy szemrevételezéssel ellenőrizzük a normál eloszlásra jellemző harang alakot. - Q-Q plot (Quantile-Quantile plot): A minta kvantiliseinek összehasonlítása a normál eloszlás kvantilisaival. Ha az adatok normál eloszlásúak, a pontok egy egyenes vonalon fognak elhelyezkedni.

2. Statikus tesztek: - Shapiro-Wilk teszt: A legelterjedtebb normalitásvizsgálati teszt. A nullhipotézis az, hogy az adatok normál eloszlásúak. - Kolmogorov-Smirnov teszt: Összehasonlítja a minta eloszlását a normál eloszlással. - Anderson-Darling teszt: Szintén a normál eloszlásra vonatkozóan, de érzékenyebb a szélekre, mint a Kolmogorov-Smirnov teszt.

3. Momentumszámítások: - Az adathalmaz aszimmetriájának (skewness) és csúcsosságának (kurtosis) mérése. Normális eloszlás esetén a skewness értéke 0, a kurtosis értéke pedig 3.

Példa a Shapiro-Wilk tesztre

Tegyük fel, hogy van egy adathalmozunk, amelyet meg szeretnénk vizsgálni a normalitás szempontjából.

1. Adatok: [4.5, 5.1, 5.6, 5.8, 6.2, 6.3, 7.0] 2. Nullhipotézis: Az adatok normál eloszlásúak. 3. Alternatív hipotézis: Az adatok nem normál eloszlásúak. 4. Kiszámítjuk a Shapiro-Wilk statisztikát és az ahhoz tartozó p-értéket.

- Ha a p-érték > 0.05, akkor nem utasítjuk el a nullhipotézist, tehát az adatok normál eloszlásúnak tekinthetők. - Ha a p-érték ≤ 0.05, akkor elutasítjuk a nullhipotézist, tehát az adatok nem normál eloszlásúak.

Összegzés

A normalitásvizsgálat kulcsfontosságú lépés a statisztikai elemzések során, mivel biztosítja, hogy a használt statisztikai tesztek érvényesek legyenek. A grafikus és statisztikai módszerek kombinálása segít megbízható következtetéseket levonni az adatok eloszlásáról.