La deviazione standard è un concetto che viene tirato in ballo spesso in finanza.
E allora cos’è?
Quando lavoriamo con un insieme di dati quantitativi, una delle prime cose che vogliamo sapere è quale sia l’elemento “tipico” dell’insieme, o dove si trovi il centro dell’insieme.
Lo facciamo trovando una media o una mediana, o qualche altra misura relativa alla media.
Ma conoscere il centro dell’insieme non ci dice tutto. Vogliamo anche sapere di più sulla forma complessiva dei nostri dati.
La deviazione standard è una misura di quanto sia diffusa una serie di dati. È usata in un numero enorme di applicazioni. In finanza, le deviazioni standard dei dati sui prezzi sono spesso usate come misura della volatilità. Nei sondaggi di opinione, le deviazioni standard sono una parte fondamentale del calcolo dei margini di errore.
Primo, guardiamo cosa misura una deviazione standard.
Considera due piccole imprese con quattro dipendenti ciascuna. In un’azienda, due dipendenti guadagnano 19 dollari l’ora e gli altri due guadagnano 21. Nella seconda azienda, due dipendenti guadagnano 15 dollari l’ora, uno guadagna 24 dollari e l’ultimo guadagna 26 dollari:
In entrambe le aziende, il salario medio è di 20 dollari l’ora, ma la distribuzione dei salari orari è chiaramente diversa. Nell’azienda A, i salari di tutti e quattro i dipendenti sono strettamente raggruppati intorno a quella media, mentre nell’azienda B, c’è una grande differenza tra i due dipendenti che guadagnano 15 dollari e gli altri due dipendenti.
La deviazione standard è una misura di quanto le misure individuali tendono ad essere lontane dal valore medio di una serie di dati. La deviazione standard dei dipendenti dell’azienda A è 1, mentre la deviazione standard dei salari dell’azienda B è circa 5. In generale, più grande è la deviazione standard di una serie di dati, più i singoli punti sono distanti in quella serie.
Tecnicamente, è più complicato
La definizione tecnica della deviazione standard è un po’ complicata. Per prima cosa, per ogni valore di dati, scoprite quanto il valore è lontano dalla media prendendo la differenza del valore e la media. Poi, eleva al quadrato tutte queste differenze. Poi, prendi la media di queste differenze al quadrato. Infine, prendete la radice quadrata di questa media.
La ragione per cui passiamo attraverso un processo così complicato per definire la deviazione standard è che questa misura appare come un parametro in un certo numero di formule statistiche e probabilistiche, in particolare la distribuzione normale.
La distribuzione normale è uno strumento estremamente importante in statistica. La forma di una distribuzione normale è una curva a campana, come quella nell’immagine.
Quella curva mostra, approssimativamente, quanto è probabile che un processo casuale che segue una distribuzione normale assuma un particolare valore lungo l’asse orizzontale. I valori vicini al picco, dove la curva è più alta, sono più probabili dei valori più lontani, dove la curva è più vicina all’asse orizzontale.
Le distribuzioni normali appaiono in situazioni in cui si verifica un gran numero di eventi casuali indipendenti ma simili. Cose come l’altezza delle persone in una particolare popolazione tendono a seguire approssimativamente una distribuzione normale.
Le deviazioni standard sono importanti qui perché la forma di una curva normale è determinata dalla sua media e deviazione standard. La media ti dice dove dovrebbe andare la parte centrale e più alta della curva. La deviazione standard ti dice quanto sottile o larga sarà la curva. Se conoscete questi due numeri, sapete tutto quello che dovete sapere sulla forma della vostra curva.
Invertendo questa idea, le distribuzioni normali ci danno anche un buon modo per interpretare le deviazioni standard. In qualsiasi distribuzione normale, ci sono probabilità fisse per gli intervalli intorno alla media, basate su multipli della deviazione standard della distribuzione.
In particolare, circa due terzi delle misure di una quantità distribuita normalmente dovrebbero cadere entro una deviazione standard della media, il 95% delle misure entro due deviazioni standard della media, e il 99.7% entro tre deviazioni standard della media.
Questa illustrazione della curva normale elenca questi valori:
Supponiamo che ci sia un test standard che centinaia di migliaia di studenti fanno. Se le domande del test sono ben progettate, i punteggi degli studenti dovrebbero essere approssimativamente distribuiti normalmente. Diciamo che il punteggio medio del test è 100, con una deviazione standard di 10 punti. La regola di cui sopra significa che circa due terzi degli studenti dovrebbero avere punteggi tra 90 e 110, il 95% degli studenti dovrebbe essere tra 80 e 120, e quasi tutti gli studenti – il 99,7% – dovrebbero avere punteggi entro tre deviazioni standard dalla media.
Qualsiasi domanda?