6 módszer a normális eloszlás tesztelésére - melyiket használjuk?

Sok módszer létezik annak tesztelésére, hogy egy változó normális eloszlású-e. Ebben a cikkben megtudhatod, melyiket érdemes használni!
1.1. Bevezetés
1.2. A hisztogram az adathalmazon belüli eloszlást. Értelmezés
1.3. A normális eloszlástól való eltérés. Megvalósítás
1.4. Következtetés
2.1. A hisztogram egy nagyszerű módszer egy változó eloszlásának gyors megjelenítésére. Bevezetés
2.2. Értelmezés
2.3. A normális eloszlás és a normális haranggörbe összehasonlítása. Megvalósítás
2.4. Következtetés
3.1. Bevezetés
3.2. A kvantilisek ábrázolása. Értelmezés
3.3. A normális eloszlás. Megvalósítás
3.4. QQ Plot létrehozása a statsmodels segítségével. Következtetés
Kolmogorov Smirnov teszt
4.2. A normális eloszlás tesztje. Értelmezés
4.3. A KS-próba P-értéke a normális eloszlásra utal. Megvalósítás
4.4. A KS-teszt alkalmazása Pythonban Scipy segítségével 4.4. A KS-tesztet a Scipy segítségével alkalmazzuk. Következtetés
Lilliefors-teszt
5.2. A Lilliefors-próba nem a Kolmogorov-eloszlást használja. Értelmezés
5.3. Implementáció
5.4. alkalmazásával. Következtetés
Shapiro Wilk teszt
6.2. A Shapiro Wilk-teszt a legerősebb teszt, amikor normális eloszlást tesztelünk. Értelmezés
6.3. Megvalósítás
6.4. A Shapiro Wilk-teszt alkalmazása a Pythonban . Következtetés
Következtetés – milyen megközelítést használj!

Sok módszer létezik annak tesztelésére, hogy egy változó normális eloszlású-e. Ebben a cikkben megtudhatod, melyiket érdemes használni!

1.1. Bevezetés

Az első módszer, amelyet szinte mindenki ismer, a hisztogram. A hisztogram egy olyan adatvizualizáció, amely egy változó eloszlását mutatja. Megadja nekünk az értékenkénti előfordulási gyakoriságot az adathalmazban, amiről az eloszlások szólnak.

A hisztogram nagyszerű módja annak, hogy gyorsan szemléltessük egyetlen változó eloszlását.

1.2. A hisztogram az adathalmazon belüli eloszlást. Értelmezés

A lenti képen két hisztogram egy normális és egy nem normális eloszlást mutat.

A bal oldalon a minta eloszlása (szürke színnel) nagyon kis mértékben tér el az elméleti haranggörbe-eloszlástól (piros vonal).
A jobb oldalon egészen más alakot látunk a hisztogramon, ami egyenesen elárulja, hogy nem normális eloszlásról van szó.

Néha a normális eloszlástól való eltérés annyira nyilvánvaló, hogy vizuálisan is észrevehető.

1.3. A normális eloszlástól való eltérés. Megvalósítás

A hisztogram könnyen létrehozható pythonban az alábbiak szerint:

Hisztogram készítése pandas segítségével pythonban

1.4. Következtetés

A hisztogram nagyszerű módja annak, hogy gyorsan szemléltessük egyetlen változó eloszlását.

2.1. A hisztogram egy nagyszerű módszer egy változó eloszlásának gyors megjelenítésére. Bevezetés

A Box Plot egy másik vizualizációs technika, amely a nem normális minták kimutatására használható. A Box Plot egy változó 5 számjegyű összegzését ábrázolja: minimum, első kvartilis, medián, harmadik kvartilis és maximum.

A boxplot egy nagyszerű módszer több változó eloszlásának egyidejű vizualizálására.

2.2. Értelmezés

A boxplot egy nagyszerű vizualizációs technika, mert lehetővé teszi sok boxplot egymás melletti ábrázolását. A változók ilyen nagyon gyors áttekintése képet ad az eloszlásról, és “bónuszként” megkapjuk a teljes 5 számjegyű összefoglalót, ami segít a további elemzésben.

Két dolgot kell megvizsgálni:

Az eloszlás szimmetrikus (mint a normális eloszlás)?
A szélesség (a pontszerűség ellentéte) megfelel a normális eloszlás szélességének? Ez nehezen látható egy dobozdiagramon.

Normális (balra), egyenletes (középen) és exponenciális (jobbra) boxplotok vs. normál haranggörbe

Sok módszer létezik annak tesztelésére, hogy egy változó normális eloszlású-e. Ebben a cikkben megtudhatod, melyiket érdemes használni!

1.1. Bevezetés

1.2. A hisztogram az adathalmazon belüli eloszlást. Értelmezés

1.3. A normális eloszlástól való eltérés. Megvalósítás

1.4. Következtetés

1.4. Következtetés

2.1. A hisztogram egy nagyszerű módszer egy változó eloszlásának gyors megjelenítésére. Bevezetés

2.2. Értelmezés

2.3. A normális eloszlás és a normális haranggörbe összehasonlítása. Megvalósítás

2.4. Következtetés

2.4. Következtetés

3.1. Bevezetés

3.2. A kvantilisek ábrázolása. Értelmezés

3.3. A normális eloszlás. Megvalósítás

3.4. QQ Plot létrehozása a statsmodels segítségével. Következtetés

segítségével. Következtetés

Kolmogorov Smirnov teszt

4.2. A normális eloszlás tesztje. Értelmezés

4.3. A KS-próba P-értéke a normális eloszlásra utal. Megvalósítás

4.4. A KS-teszt alkalmazása Pythonban Scipy segítségével 4.4. A KS-tesztet a Scipy segítségével alkalmazzuk. Következtetés

4.4. A KS-tesztet a Scipy segítségével alkalmazzuk. Következtetés

Lilliefors-teszt

5.2. A Lilliefors-próba nem a Kolmogorov-eloszlást használja. Értelmezés

5.3. Implementáció

5.4. alkalmazásával. Következtetés

Shapiro Wilk teszt

6.2. A Shapiro Wilk-teszt a legerősebb teszt, amikor normális eloszlást tesztelünk. Értelmezés

6.3. Megvalósítás

6.4. A Shapiro Wilk-teszt alkalmazása a Pythonban . Következtetés

. Következtetés

Következtetés – milyen megközelítést használj!

Related Post

Vélemény, hozzászólás? Kilépés a válaszból

You missed

3.4. QQ Plot létrehozása a statsmodels

segítségével. Következtetés

4.4. A KS-teszt alkalmazása Pythonban Scipy segítségével

4.4. A KS-tesztet a Scipy segítségével alkalmazzuk. Következtetés

6.4. A Shapiro Wilk-teszt alkalmazása a Pythonban

. Következtetés