Standaardafwijking is een begrip dat in de financiële wereld vaak wordt gebruikt.
Wat is het?
Wanneer we met een kwantitatieve gegevensverzameling werken, is een van de eerste dingen die we willen weten hoe het “typische” element van de verzameling eruitziet, of waar het midden van de verzameling is.
Dit doen we door een gemiddelde of een mediaan te vinden, of een andere verwante maat voor het gemiddelde.
Maar weten wat het midden van de verzameling is, zegt ons nog niet alles. We willen ook meer weten over de algemene vorm van onze gegevens.
Standaardafwijking is een maat voor de spreiding van een gegevensverzameling. Het wordt gebruikt in een groot aantal toepassingen. In de financiële wereld worden standaardafwijkingen van prijsgegevens vaak gebruikt als maatstaf voor de volatiliteit. In opiniepeilingen zijn standaardafwijkingen een belangrijk onderdeel van de berekening van foutmarges.
Laten we eerst eens kijken naar wat een standaardafwijking meet.
Neem twee kleine bedrijven met elk vier werknemers. In het ene bedrijf verdienen twee werknemers $ 19 per uur en de andere twee $ 21. In het tweede bedrijf verdienen twee werknemers $ 15 per uur, één $ 24 en de laatste $ 26:
In beide bedrijven is het gemiddelde loon $ 20 per uur, maar de verdeling van de uurlonen is duidelijk anders. In bedrijf A liggen de lonen van alle vier de werknemers dicht bij dat gemiddelde, terwijl er in bedrijf B een grote spreiding is tussen de twee werknemers die $15 verdienen en de andere twee werknemers.
Standaardafwijking is een maat voor de afstand tussen individuele metingen en de gemiddelde waarde van een gegevensverzameling. De standaardafwijking van de werknemers van bedrijf A is 1, terwijl de standaardafwijking van de lonen van bedrijf B ongeveer 5 is. In het algemeen geldt dat hoe groter de standaardafwijking van een gegevensverzameling is, hoe meer de afzonderlijke punten in die verzameling uit elkaar liggen.
Technisch is het ingewikkelder
De technische definitie van standaardafwijking is enigszins ingewikkeld. Eerst bepaalt u voor elke waarde hoe ver die waarde van het gemiddelde afligt door het verschil tussen de waarde en het gemiddelde te nemen. Kwadrateer vervolgens al die verschillen. Neem vervolgens het gemiddelde van deze gekwadrateerde verschillen. Neem tenslotte de vierkantswortel van dat gemiddelde.
De reden waarom we zo’n ingewikkeld proces doorlopen om standaardafwijking te definiëren, is dat deze maat als parameter in een aantal statistische en probabilistische formules voorkomt, met name in de normale verdeling.
De normale verdeling is een uiterst belangrijk hulpmiddel in de statistiek. De vorm van een normale verdeling is een klokvormige curve, zoals die in de afbeelding.
Deze kromme geeft ruwweg aan hoe groot de kans is dat een willekeurig proces dat een normale verdeling volgt, een bepaalde waarde langs de horizontale as zal aannemen. Waarden in de buurt van de piek, waar de curve het hoogst is, zijn waarschijnlijker dan waarden verder weg, waar de curve dichter bij de horizontale as ligt.
Normale verdelingen komen voor in situaties waarin zich een groot aantal onafhankelijke, maar vergelijkbare willekeurige gebeurtenissen voordoet. Dingen zoals de lengte van mensen in een bepaalde populatie hebben de neiging om ruwweg een normale verdeling te volgen.
Standaardafwijkingen zijn hier belangrijk omdat de vorm van een normale kromme wordt bepaald door het gemiddelde en de standaardafwijking. Het gemiddelde vertelt u waar het middelste, hoogste deel van de curve moet komen. De standaardafwijking vertelt je hoe smal of breed de curve zal zijn. Als je deze twee getallen kent, weet je alles wat je moet weten over de vorm van je kromme.
Draai dit idee om, normale verdelingen geven ons ook een goede manier om standaardafwijkingen te interpreteren. In elke normale verdeling zijn er vaste waarschijnlijkheden voor intervallen rond het gemiddelde, gebaseerd op veelvouden van de standaardafwijking van de verdeling.
In het bijzonder zou ongeveer tweederde van de metingen van een normaal verdeelde grootheid binnen één standaardafwijking van het gemiddelde moeten vallen, 95% van de metingen binnen twee standaardafwijkingen van het gemiddelde, en 99,7% binnen drie standaardafwijkingen van het gemiddelde.7% binnen drie standaardafwijkingen van het gemiddelde.
Deze illustratie van de normale curve noemt deze waarden:
Stel dat er een gestandaardiseerde test is die honderdduizenden studenten maken. Als de vragen van de test goed zijn ontworpen, zouden de scores van de studenten ruwweg normaal verdeeld moeten zijn. Stel dat de gemiddelde score op de test 100 is, met een standaardafwijking van 10 punten. De bovengenoemde regel betekent dat ongeveer tweederde van de studenten een score tussen 90 en 110 zou moeten hebben, 95% van de studenten zou tussen 80 en 120 moeten zitten, en bijna alle studenten – 99,7% – zouden scores moeten hebben binnen drie standaardafwijkingen van het gemiddelde.
Enige vragen?