Standardabweichung ist ein Konzept, das in der Finanzwelt häufig verwendet wird.
Was ist das eigentlich?
Wenn wir mit einem quantitativen Datensatz arbeiten, wollen wir zunächst einmal wissen, wie das „typische“ Element des Satzes aussieht oder wo die Mitte des Satzes liegt.
Dazu ermitteln wir einen Mittelwert oder einen Median oder ein anderes verwandtes Maß für den Durchschnitt.
Aber die Mitte des Satzes zu kennen, sagt uns nicht alles. Wir wollen auch mehr über die Gesamtform unserer Daten wissen.
Die Standardabweichung ist ein Maß dafür, wie weit ein Datensatz gestreut ist. Sie wird in einer großen Anzahl von Anwendungen verwendet. Im Finanzwesen werden Standardabweichungen von Preisdaten häufig als Maß für die Volatilität verwendet. Bei Meinungsumfragen sind Standardabweichungen ein wichtiger Bestandteil der Berechnung von Fehlermargen.
Zunächst wollen wir uns ansehen, was eine Standardabweichung misst.
Betrachten wir zwei kleine Unternehmen mit jeweils vier Beschäftigten. In einem Unternehmen verdienen zwei Angestellte 19 Dollar pro Stunde und die anderen beiden 21 Dollar. Im zweiten Unternehmen verdienen zwei Angestellte 15 Dollar pro Stunde, einer 24 Dollar und der letzte 26 Dollar:
In beiden Unternehmen beträgt der Durchschnittslohn 20 Dollar pro Stunde, aber die Verteilung der Stundenlöhne ist deutlich unterschiedlich. In Unternehmen A liegen die Löhne aller vier Beschäftigten eng um diesen Durchschnittswert herum, während in Unternehmen B eine große Spanne zwischen den beiden Beschäftigten, die 15 Dollar verdienen, und den beiden anderen Beschäftigten besteht.
Die Standardabweichung ist ein Maß dafür, wie weit die einzelnen Messwerte vom Mittelwert eines Datensatzes entfernt sind. Die Standardabweichung der Mitarbeiter von Unternehmen A beträgt 1, während die Standardabweichung der Löhne von Unternehmen B etwa 5 beträgt. Im Allgemeinen gilt: Je größer die Standardabweichung eines Datensatzes ist, desto weiter liegen die einzelnen Punkte in diesem Satz auseinander.
Technisch ist es komplizierter
Die technische Definition der Standardabweichung ist etwas kompliziert. Zunächst wird für jeden Datenwert herausgefunden, wie weit der Wert vom Mittelwert entfernt ist, indem die Differenz zwischen dem Wert und dem Mittelwert gebildet wird. Dann quadrieren Sie alle diese Differenzen. Dann wird der Durchschnitt dieser quadrierten Differenzen ermittelt. Schließlich nimmt man die Quadratwurzel aus diesem Durchschnitt.
Der Grund, warum wir einen so komplizierten Prozess durchlaufen, um die Standardabweichung zu definieren, ist, dass dieses Maß als Parameter in einer Reihe von statistischen und probabilistischen Formeln erscheint, insbesondere in der Normalverteilung.
Die Normalverteilung ist ein äußerst wichtiges Werkzeug in der Statistik. Die Form einer Normalverteilung ist eine glockenförmige Kurve, wie die in der Abbildung.
Diese Kurve zeigt, grob gesagt, wie wahrscheinlich es ist, dass ein Zufallsprozess, der einer Normalverteilung folgt, einen bestimmten Wert entlang der horizontalen Achse annimmt. Werte in der Nähe des Scheitelpunkts, wo die Kurve am höchsten ist, sind wahrscheinlicher als weiter entfernte Werte, wo die Kurve näher an der horizontalen Achse liegt.
Normalverteilungen treten in Situationen auf, in denen eine große Anzahl unabhängiger, aber ähnlicher Zufallsereignisse auftritt. Dinge wie die Körpergröße von Menschen in einer bestimmten Population neigen dazu, grob einer Normalverteilung zu folgen.
Standardabweichungen sind hier wichtig, weil die Form einer Normalkurve durch ihren Mittelwert und ihre Standardabweichung bestimmt wird. Der Mittelwert gibt an, wo der mittlere, höchste Teil der Kurve liegen sollte. Die Standardabweichung gibt an, wie dünn oder breit die Kurve sein wird. Wenn Sie diese beiden Zahlen kennen, wissen Sie alles, was Sie über die Form Ihrer Kurve wissen müssen.
Umgekehrt geben uns Normalverteilungen auch eine gute Möglichkeit, Standardabweichungen zu interpretieren. In jeder Normalverteilung gibt es feste Wahrscheinlichkeiten für Intervalle um den Mittelwert, die auf Vielfachen der Standardabweichung der Verteilung basieren.
Insbesondere sollten etwa zwei Drittel der Messungen einer normalverteilten Größe innerhalb einer Standardabweichung des Mittelwerts liegen, 95% der Messungen innerhalb von zwei Standardabweichungen des Mittelwerts und 99.7% innerhalb von drei Standardabweichungen des Mittelwerts liegen.
Diese Abbildung der Normalkurve zeigt diese Werte:
Angenommen, es gibt einen standardisierten Test, den Hunderttausende von Schülern absolvieren. Wenn die Fragen des Tests gut konzipiert sind, sollten die Ergebnisse der Schüler ungefähr normalverteilt sein. Nehmen wir an, der Mittelwert des Tests ist 100, mit einer Standardabweichung von 10 Punkten. Die oben genannte Regel bedeutet, dass etwa zwei Drittel der Schüler eine Punktzahl zwischen 90 und 110 haben sollten, 95 % der Schüler sollten zwischen 80 und 120 liegen, und fast alle Schüler – 99,7 % – sollten eine Punktzahl innerhalb von drei Standardabweichungen vom Mittelwert haben.
Sind Fragen offen?