Flickr via Google Images

標準偏差は、金融でよく使われる概念です。

定量的データ セットを扱う場合、最初に知りたいことの 1 つは、セットの「典型的な」要素がどのようなものか、またはセットの中央がどこであるかということです。

標準偏差は、データセットがどの程度広がっているかを示す尺度です。 これは、非常に多くのアプリケーションで使用されています。 金融では、価格データの標準偏差はボラティリティの指標として頻繁に使用されます。 世論調査では、標準偏差は誤差を計算するための重要な要素です。

まず、標準偏差が何を測定しているかを見てみましょう。

それぞれ4人の従業員を持つ2つの中小企業を考えてみましょう。 ある企業では、2人の従業員が時給19ドル、他の2人が21ドルを稼いでいます。 2番目の企業では、2人の従業員が時給15ドル、1人が24ドル、最後の1人が26ドルを稼いでいます。

Business Insider/Andy Kiersz

どちらの企業でも平均時給は20ドルですが、時給の分布は明らかに異なっています。 A社では4人の社員の賃金がその平均を中心にきっちりまとまっているのに対し、B社では15ドルの社員2人とそれ以外の社員との間に大きな開きがあるのです。

標準偏差とは、データセットの平均値から個々の測定値がどれだけ離れている傾向があるかを示す尺度である。 一般に、データセットの標準偏差が大きいほど、そのセットで個々のポイントがより広がっています。

Technically, It’s More Complicated

標準偏差の技術定義は多少複雑になっています。 まず、各データ値について、その値と平均値との差をとることで、その値が平均値からどれだけ離れているかを求めます。 そして、その差をすべて二乗します。 次に、それらの差の二乗の平均をとります。 最後に、その平均値の平方根をとります。

標準偏差を定義するためにこのような複雑なプロセスを踏む理由は、この尺度が多くの統計および確率式、特に正規分布のパラメータとして登場するからです。

Wikimedia Commons

正規分布は、統計学において非常に重要なツールです。 正規分布の形は、画像のようなベル型の曲線です。

その曲線は、大まかに言って、正規分布に従うランダムな過程が、横軸に沿った特定の値をとる可能性がどの程度あるかを示しています。 曲線が最も高いピーク付近の値は、曲線が水平軸に近い遠くの値よりも可能性が高くなります。

正規分布は、独立しているが同様のランダムなイベントが多数発生している状況で表示されます。 特定の集団の人々の身長のようなものは、ほぼ正規分布に従う傾向があります。

正規曲線の形状は、その平均と標準偏差によって決まるので、ここでは標準偏差が重要です。 平均は、曲線の中央、最も高い部分がどこに行くべきかを教えてくれます。 標準偏差は、曲線がどの程度細くなるか、または広くなるかを示しています。 これらの 2 つの数字を知っていれば、曲線の形状について知る必要があるすべてがわかります。

この考えを裏返して、正規分布はまた、標準偏差を解釈する良い方法を与えてくれます。 どの正規分布でも、分布の標準偏差の倍数に基づいて、平均値付近の区間に一定の確率があります。

特に、正規分布する量の測定値の約 3 分の 2 が平均値の 1 標準偏差内に、95% が平均値の 2 標準偏差内に、そして 99.が平均値の 2 標準偏差内に入るはずです。

この正規曲線の図には、これらの値が記載されています:

Dan Kernler, via Wikimedia Commons

数十万人の学生が受ける標準テストがあるとします。 もしテストの問題がうまく設計されていれば、学生の得点はほぼ正規分布になるはずです。 テストの平均点が100点で、標準偏差が10点だとします。 前述のルールは、学生の約3分の2が90~110点、95%が80~120点、そしてほぼ全員(99.7%)が平均から3標準偏差以内の点数であるべきだということを意味しています

何か質問はありますか?

コメントを残す

メールアドレスが公開されることはありません。