Flickr via Google Images

A standard eltérés egy olyan fogalom, amelyet a pénzügyekben gyakran emlegetnek.

Mi is ez?

Amikor egy mennyiségi adathalmazzal dolgozunk, az egyik első dolog, amit tudni akarunk, hogy milyen a halmaz “tipikus” eleme, vagy hogy hol van a halmaz közepe.

Ez úgy történik, hogy megkeressük az átlagot vagy a mediánt, vagy az átlag valamilyen más kapcsolódó mértékegységét.

A halmaz közepének ismerete azonban nem mond el mindent. Többet akarunk tudni az adataink általános alakjáról is.

A szórás az adathalmaz szóródásának mértékegysége. Rengeteg alkalmazásban használják. A pénzügyekben az áradatok standard eltéréseit gyakran használják a volatilitás mértékeként. A közvélemény-kutatásban a szórás a hibahatárok kiszámításának kulcsfontosságú része.

Először nézzük meg, mit is mér a szórás.

Gondoljunk két kisvállalkozásra, amelyeknek egyenként négy alkalmazottjuk van. Az egyik vállalkozásban két alkalmazott 19 dollárt keres óránként, a másik kettő pedig 21 dollárt. A másik vállalkozásban két alkalmazott 15 dollárt keres óránként, egy 24 dollárt, az utolsó pedig 26 dollárt:

Business Insider/Andy Kiersz

Az átlagbér mindkét vállalkozásban 20 dollár óránként, de az órabérek eloszlása egyértelműen eltérő. Az A vállalatnál mind a négy alkalmazott bére szorosan e köré az átlag köré csoportosul, míg a B vállalatnál nagy a szórás a 15 dollárt kereső két alkalmazott és a másik két alkalmazott között.

A szórás azt méri, hogy az egyes mérések mennyire távolodnak el egy adathalmaz átlagértékétől. Az A vállalat alkalmazottainak szórása 1, míg a B vállalat béreinek szórása körülbelül 5. Általában minél nagyobb egy adathalmaz szórása, annál jobban szóródnak az egyes pontok az adott halmazban.

Technikailag bonyolultabb

A szórás technikai meghatározása kissé bonyolult. Először is, minden egyes adatérték esetében meg kell állapítani, hogy az érték milyen messze van az átlagtól úgy, hogy az érték és az átlag különbségét vesszük. Ezután az összes ilyen különbséget négyzetre kell szorozni. Ezután számítsuk ki a négyzetelt különbségek átlagát. Végül vegyük ki ennek az átlagnak a négyzetgyökét.

A szórás meghatározásának ilyen bonyolult folyamatát azért végezzük el, mert ez a mérték számos statisztikai és valószínűségi képletben, különösen a normális eloszlásban paraméterként szerepel.

Wikimedia Commons

A normális eloszlás a statisztika rendkívül fontos eszköze. A normális eloszlás alakja egy harang alakú görbe, mint a képen látható.

Ez a görbe nagyjából azt mutatja meg, hogy egy normális eloszlást követő véletlen folyamat milyen valószínűséggel vesz fel egy adott értéket a vízszintes tengely mentén. A csúcshoz közeli értékek, ahol a görbe a legmagasabb, valószínűbbek, mint a távolabbi értékek, ahol a görbe közelebb van a vízszintes tengelyhez.

A normális eloszlások olyan helyzetekben jelennek meg, ahol nagyszámú független, de hasonló véletlen esemény fordul elő. Az olyan dolgok, mint például az emberek magassága egy adott populációban, általában nagyjából normális eloszlást követnek.

A standard eltérések azért fontosak itt, mert a normális görbe alakját az átlag és a standard eltérés határozza meg. Az átlag megmondja, hogy a görbe középső, legmagasabb részének hol kell elhelyezkednie. A szórás megmondja, hogy milyen vékony vagy széles lesz a görbe. Ha ismeri ezt a két számot, akkor mindent tud, amit a görbe alakjáról tudnia kell.

A gondolatot megfordítva, a normáleloszlások a szórások értelmezésére is jó lehetőséget adnak. Bármely normális eloszlásban az átlag körüli intervallumokhoz rögzített valószínűségek tartoznak, amelyek az eloszlás szórásának többszörösén alapulnak.

Egy normális eloszlású mennyiség méréseinek körülbelül kétharmada az átlag egy szórásán belülre esik, a mérések 95%-a az átlag két szórásán belülre, és 99 %.7%-a az átlag három szórásán belül legyen.

A normális görbe ezen ábrája ezeket az értékeket sorolja fel:

Dan Kernler, via Wikimedia Commons

Tegyük fel, hogy van egy szabványosított teszt, amelyet diákok százezrei írnak meg. Ha a teszt kérdései jól vannak megtervezve, akkor a diákok pontszámainak nagyjából normális eloszlásúnak kell lenniük. Tegyük fel, hogy a teszt átlaga 100 pont, a szórás pedig 10 pont. A fent említett szabály azt jelenti, hogy a tanulók körülbelül kétharmadának 90 és 110 közötti pontszámmal kell rendelkeznie, a tanulók 95%-ának 80 és 120 között kell lennie, és majdnem minden tanulónak – 99,7%-nak – az átlagtól számított három szóráson belüli pontszámmal kell rendelkeznie.

Kérdések?

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.