- Sok módszer létezik annak tesztelésére, hogy egy változó normális eloszlású-e. Ebben a cikkben megtudhatod, melyiket érdemes használni!
- 1.1. Bevezetés
- 1.2. A hisztogram az adathalmazon belüli eloszlást. Értelmezés
- 1.3. A normális eloszlástól való eltérés. Megvalósítás
- 1.4. Következtetés
- 2.1. A hisztogram egy nagyszerű módszer egy változó eloszlásának gyors megjelenítésére. Bevezetés
- 2.2. Értelmezés
- 2.3. A normális eloszlás és a normális haranggörbe összehasonlítása. Megvalósítás
- 2.4. Következtetés
- 3.1. Bevezetés
- 3.2. A kvantilisek ábrázolása. Értelmezés
- 3.3. A normális eloszlás. Megvalósítás
- 3.4. QQ Plot létrehozása a statsmodels segítségével. Következtetés
- Kolmogorov Smirnov teszt
- 4.2. A normális eloszlás tesztje. Értelmezés
- 4.3. A KS-próba P-értéke a normális eloszlásra utal. Megvalósítás
- 4.4. A KS-teszt alkalmazása Pythonban Scipy segítségével 4.4. A KS-tesztet a Scipy segítségével alkalmazzuk. Következtetés
- Lilliefors-teszt
- 5.2. A Lilliefors-próba nem a Kolmogorov-eloszlást használja. Értelmezés
- 5.3. Implementáció
- 5.4. alkalmazásával. Következtetés
- Shapiro Wilk teszt
- 6.2. A Shapiro Wilk-teszt a legerősebb teszt, amikor normális eloszlást tesztelünk. Értelmezés
- 6.3. Megvalósítás
- 6.4. A Shapiro Wilk-teszt alkalmazása a Pythonban . Következtetés
- Következtetés – milyen megközelítést használj!
Sok módszer létezik annak tesztelésére, hogy egy változó normális eloszlású-e. Ebben a cikkben megtudhatod, melyiket érdemes használni!
1.1. Bevezetés
Az első módszer, amelyet szinte mindenki ismer, a hisztogram. A hisztogram egy olyan adatvizualizáció, amely egy változó eloszlását mutatja. Megadja nekünk az értékenkénti előfordulási gyakoriságot az adathalmazban, amiről az eloszlások szólnak.
A hisztogram nagyszerű módja annak, hogy gyorsan szemléltessük egyetlen változó eloszlását.
1.2. A hisztogram az adathalmazon belüli eloszlást. Értelmezés
A lenti képen két hisztogram egy normális és egy nem normális eloszlást mutat.
- A bal oldalon a minta eloszlása (szürke színnel) nagyon kis mértékben tér el az elméleti haranggörbe-eloszlástól (piros vonal).
- A jobb oldalon egészen más alakot látunk a hisztogramon, ami egyenesen elárulja, hogy nem normális eloszlásról van szó.
1.3. A normális eloszlástól való eltérés. Megvalósítás
A hisztogram könnyen létrehozható pythonban az alábbiak szerint:
1.4. Következtetés
A hisztogram nagyszerű módja annak, hogy gyorsan szemléltessük egyetlen változó eloszlását.
2.1. A hisztogram egy nagyszerű módszer egy változó eloszlásának gyors megjelenítésére. Bevezetés
A Box Plot egy másik vizualizációs technika, amely a nem normális minták kimutatására használható. A Box Plot egy változó 5 számjegyű összegzését ábrázolja: minimum, első kvartilis, medián, harmadik kvartilis és maximum.
A boxplot egy nagyszerű módszer több változó eloszlásának egyidejű vizualizálására.
2.2. Értelmezés
A boxplot egy nagyszerű vizualizációs technika, mert lehetővé teszi sok boxplot egymás melletti ábrázolását. A változók ilyen nagyon gyors áttekintése képet ad az eloszlásról, és “bónuszként” megkapjuk a teljes 5 számjegyű összefoglalót, ami segít a további elemzésben.
Két dolgot kell megvizsgálni:
- Az eloszlás szimmetrikus (mint a normális eloszlás)?
- A szélesség (a pontszerűség ellentéte) megfelel a normális eloszlás szélességének? Ez nehezen látható egy dobozdiagramon.