Standardafvigelse er et begreb, der ofte bruges i finansverdenen.
Så hvad er det?
Når vi arbejder med et kvantitativt datasæt, er en af de første ting, vi ønsker at vide, hvordan det “typiske” element i sættet ser ud, eller hvor midten af sættet er.
Vi gør dette ved at finde en middelværdi eller en median eller et andet beslægtet mål for gennemsnittet.
Men at kende midten af sættet fortæller os ikke alt. Vi ønsker også at vide mere om den overordnede form af vores data.
Standardafvigelse er et mål for, hvor spredt et datasæt er. Det bruges i en lang række applikationer. Inden for finanssektoren anvendes standardafvigelser af prisdata ofte som et mål for volatilitet. I meningsmålinger er standardafvigelser en vigtig del af beregningen af fejlmarginaler.
Først skal vi se på, hvad en standardafvigelse måler.
Tænk på to små virksomheder med fire ansatte hver. I den ene virksomhed tjener to medarbejdere 19 dollars i timen, og de to andre tjener 21 dollars. I den anden virksomhed tjener to medarbejdere 15 dollars i timen, en tjener 24 dollars, og den sidste tjener 26 dollars:
I begge virksomheder er gennemsnitslønnen 20 dollars i timen, men fordelingen af timelønnen er klart forskellig. I virksomhed A er alle fire medarbejderes lønninger tæt samlet omkring dette gennemsnit, mens der i virksomhed B er en stor spredning mellem de to medarbejdere, der tjener 15 dollar, og de to andre medarbejdere.
Standardafvigelse er et mål for, hvor langt de enkelte målinger har tendens til at være væk fra middelværdien af et datasæt. Standardafvigelsen for virksomhed A’s ansatte er 1, mens standardafvigelsen for virksomhed B’s lønninger er ca. 5. Generelt gælder det, at jo større standardafvigelsen for et datasæt er, jo mere spredt er de enkelte punkter i dette sæt.
Teknisk er det mere kompliceret
Den tekniske definition af standardafvigelse er noget kompliceret. Først skal du for hver dataværdi finde ud af, hvor langt værdien er fra middelværdien ved at tage forskellen mellem værdien og middelværdien. Derefter kvadreres alle disse forskelle. Derefter beregnes gennemsnittet af disse kvadrerede forskelle. Til sidst tages kvadratroden af dette gennemsnit.
Den grund til, at vi gennemgår en så kompliceret proces for at definere standardafvigelse, er, at dette mål optræder som en parameter i en række statistiske og probabilistiske formler, især normalfordelingen.
Normalfordelingen er et ekstremt vigtigt værktøj i statistik. Formen på en normalfordeling er en klokkeformet kurve, som den på billedet.
Denne kurve viser, groft sagt, hvor sandsynligt det er, at en tilfældig proces, der følger en normalfordeling, vil antage en bestemt værdi langs den vandrette akse. Værdier nær toppen, hvor kurven er højest, er mere sandsynlige end værdier længere væk, hvor kurven er tættere på den vandrette akse.
Normalfordelinger forekommer i situationer, hvor der forekommer et stort antal uafhængige, men ensartede tilfældige hændelser. Ting som højder på personer i en bestemt population har en tendens til at følge en normalfordeling i grove træk.
Standardafvigelser er vigtige her, fordi formen på en normalkurve bestemmes af dens gennemsnit og standardafvigelse. Middelværdien fortæller dig, hvor den midterste, højeste del af kurven skal ligge. Standardafvigelsen fortæller dig, hvor tynd eller bred kurven vil være. Hvis du kender disse to tal, ved du alt, hvad du har brug for at vide om kurvens form.
Denne idé omvendt giver normalfordelinger os også en god måde at fortolke standardafvigelser på. I enhver normalfordeling er der faste sandsynligheder for intervaller omkring middelværdien, baseret på multipla af fordelingens standardafvigelse.
I særdeleshed bør ca. to tredjedele af målingerne af en normalfordelt størrelse falde inden for en standardafvigelse af middelværdien, 95 % af målingerne inden for to standardafvigelser af middelværdien og 99.7% inden for tre standardafvigelser fra gennemsnittet.
Denne illustration af normalkurven viser disse værdier:
Sæt, at der er en standardiseret prøve, som hundredtusindvis af elever tager. Hvis testens spørgsmål er godt udformet, bør elevernes resultater være nogenlunde normalfordelte. Lad os sige, at gennemsnitsresultatet på testen er 100 med en standardafvigelse på 10 point. Den ovennævnte regel betyder, at ca. to tredjedele af eleverne bør have en score mellem 90 og 110, 95 % af eleverne bør ligge mellem 80 og 120, og næsten alle eleverne – 99,7 % – bør have en score inden for tre standardafvigelser fra gennemsnittet.
Har du spørgsmål?