Flickr via Google Images

Standardní odchylka je pojem, který se ve financích často skloňuje.

Co to tedy je?“

Při práci s kvantitativním souborem dat chceme jako jednu z prvních věcí vědět, jak vypadá „typický“ prvek souboru, neboli kde se nachází střed souboru.

To děláme tak, že zjistíme průměr nebo medián, případně jinou příbuznou míru průměru.

Znalost středu souboru nám však neřekne vše. Chceme také vědět více o celkovém tvaru našich dat.

Standardní odchylka je mírou toho, jak je soubor dat rozprostřen. Používá se v obrovském množství aplikací. Ve financích se směrodatné odchylky cenových dat často používají jako měřítko volatility. Ve výzkumech veřejného mínění jsou směrodatné odchylky klíčovou součástí výpočtu rozpětí chyb.

Nejprve se podívejme, co směrodatná odchylka měří.

Podívejme se na dva malé podniky, z nichž každý má čtyři zaměstnance. V jednom podniku dva zaměstnanci vydělávají 19 dolarů na hodinu a další dva 21. Ve druhém podniku dva zaměstnanci vydělávají 15 dolarů na hodinu, jeden 24 a poslední 26:

Business Insider/Andy Kiersz

V obou podnicích je průměrná mzda 20 dolarů na hodinu, ale rozložení hodinových mezd je zjevně odlišné. Ve společnosti A jsou mzdy všech čtyř zaměstnanců těsně seskupeny kolem tohoto průměru, zatímco ve společnosti B je velký rozptyl mezi dvěma zaměstnanci, kteří vydělávají 15 dolarů, a dalšími dvěma zaměstnanci.

Standardní odchylka je měřítkem toho, jak daleko bývají jednotlivá měření od střední hodnoty souboru dat. Směrodatná odchylka zaměstnanců společnosti A je 1, zatímco směrodatná odchylka mezd společnosti B je přibližně 5. Obecně platí, že čím větší je směrodatná odchylka souboru dat, tím více jsou jednotlivé body v tomto souboru rozptýleny.

Technicky je to složitější

Technická definice směrodatné odchylky je poněkud komplikovaná. Nejprve pro každou datovou hodnotu zjistíme, jak daleko je tato hodnota od průměru, a to tak, že vezmeme rozdíl této hodnoty a průměru. Poté všechny tyto rozdíly odmocněte. Poté z těchto čtvercových rozdílů odečtěte průměr. Nakonec vezměte druhou odmocninu tohoto průměru.

Důvod, proč při definování směrodatné odchylky procházíme tak složitým procesem, je ten, že tato míra se objevuje jako parametr v řadě statistických a pravděpodobnostních vzorců, zejména v normálním rozdělení.

Wikimedia Commons

Normální rozdělení je mimořádně důležitým nástrojem ve statistice. Tvar normálního rozdělení je zvonovitá křivka, jako je ta na obrázku.

Tato křivka ukazuje, zhruba řečeno, jaká je pravděpodobnost, že náhodný proces řídící se normálním rozdělením nabere určitou hodnotu podél vodorovné osy. Hodnoty v blízkosti vrcholu, kde je křivka nejvyšší, jsou pravděpodobnější než hodnoty vzdálenější, kde je křivka blíže vodorovné ose.

Normální rozdělení se objevuje v situacích, kdy se vyskytuje velké množství nezávislých, ale podobných náhodných událostí. Věci jako výška lidí v určité populaci mají tendenci se zhruba řídit normálním rozdělením.

Standardní odchylky jsou zde důležité, protože tvar normální křivky je určen jejím průměrem a standardní odchylkou. Střední hodnota říká, kam by měla směřovat střední, nejvyšší část křivky. Směrodatná odchylka vám říká, jak úzká nebo široká křivka bude. Pokud znáte tato dvě čísla, víte vše, co potřebujete vědět o tvaru křivky.

Převrátíme-li tuto myšlenku, normální rozdělení nám také poskytuje dobrý způsob, jak interpretovat směrodatné odchylky. V každém normálním rozdělení existují pevné pravděpodobnosti pro intervaly kolem střední hodnoty, které jsou založeny na násobcích směrodatné odchylky rozdělení.

Konkrétně platí, že přibližně dvě třetiny měření normálně rozdělené veličiny by měly spadat do jedné směrodatné odchylky od střední hodnoty, 95 % měření do dvou směrodatných odchylek od střední hodnoty a 99 % měření do dvou směrodatných odchylek od střední hodnoty.7 % do tří směrodatných odchylek od průměru.

Tato ilustrace normální křivky uvádí tyto hodnoty:

Dan Kernler, via Wikimedia Commons

Předpokládejme, že existuje standardizovaný test, který skládají statisíce studentů. Pokud jsou otázky testu dobře navrženy, měly by být výsledky studentů rozloženy zhruba normálně. Řekněme, že průměrný výsledek testu je 100 bodů se směrodatnou odchylkou 10 bodů. Výše uvedené pravidlo znamená, že přibližně dvě třetiny studentů by měly mít skóre mezi 90 a 110 body, 95 % studentů by mělo mít skóre mezi 80 a 120 body a téměř všichni studenti – 99,7 % – by měli mít skóre do tří směrodatných odchylek od průměru.

Nějaké otázky?

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.