Flickr via Google Images

L’écart-type est un concept que l’on lance fréquemment en finance.

Alors, qu’est-ce que c’est ?

Lorsque nous travaillons avec un ensemble de données quantitatives, l’une des premières choses que nous voulons savoir est à quoi ressemble l’élément  » typique  » de l’ensemble, ou où se trouve le milieu de l’ensemble.

Nous y parvenons en trouvant une moyenne ou une médiane, ou une autre mesure connexe de la moyenne.

Mais connaître le milieu de l’ensemble ne nous dit pas tout. Nous voulons aussi en savoir plus sur la forme globale de nos données.

L’écart-type est une mesure de la dispersion d’un ensemble de données. Il est utilisé dans un très grand nombre d’applications. En finance, les écarts types des données de prix sont fréquemment utilisés comme mesure de la volatilité. Dans les sondages d’opinion, les écarts types sont un élément clé du calcul des marges d’erreur.

D’abord, voyons ce que mesure un écart type.

Considérons deux petites entreprises comptant chacune quatre employés. Dans l’une d’elles, deux employés gagnent 19 $ de l’heure et les deux autres 21 $. Dans la seconde entreprise, deux employés gagnent 15 $ de l’heure, un autre 24 $ et le dernier 26 $ :

Business Insider/Andy Kiersz

Dans les deux entreprises, le salaire moyen est de 20 $ de l’heure, mais la distribution des salaires horaires est clairement différente. Dans l’entreprise A, les salaires des quatre employés sont étroitement regroupés autour de cette moyenne, tandis que dans l’entreprise B, il y a un grand écart entre les deux employés qui gagnent 15 $ et les deux autres employés.

L’écart-type est une mesure de l’éloignement des mesures individuelles par rapport à la valeur moyenne d’un ensemble de données. L’écart type des employés de l’entreprise A est de 1, tandis que l’écart type des salaires de l’entreprise B est d’environ 5. En général, plus l’écart type d’un ensemble de données est grand, plus les points individuels sont étalés dans cet ensemble.

Techniquement, c’est plus compliqué

La définition technique de l’écart type est quelque peu compliquée. Tout d’abord, pour chaque valeur de données, déterminez la distance entre la valeur et la moyenne en prenant la différence entre la valeur et la moyenne. Ensuite, mettez au carré toutes ces différences. Ensuite, prenez la moyenne de ces différences au carré. Enfin, prenez la racine carrée de cette moyenne.

La raison pour laquelle nous passons par un processus aussi compliqué pour définir l’écart-type est que cette mesure apparaît comme un paramètre dans un certain nombre de formules statistiques et probabilistes, plus particulièrement la distribution normale.

Wikimedia Commons

La distribution normale est un outil extrêmement important en statistique. La forme d’une distribution normale est une courbe en forme de cloche, comme celle de l’image.

Cette courbe montre, grosso modo, la probabilité qu’un processus aléatoire suivant une distribution normale prenne une valeur particulière le long de l’axe horizontal. Les valeurs proches du pic, où la courbe est la plus haute, sont plus probables que les valeurs plus éloignées, où la courbe est plus proche de l’axe horizontal.

Les distributions normales apparaissent dans des situations où un grand nombre d’événements aléatoires indépendants mais similaires se produisent. Des choses comme les hauteurs des personnes dans une population particulière ont tendance à suivre grossièrement une distribution normale.

Les écarts types sont importants ici car la forme d’une courbe normale est déterminée par sa moyenne et son écart type. La moyenne vous indique où doit aller la partie centrale, la plus haute, de la courbe. L’écart-type vous indique à quel point la courbe sera étroite ou large. Si vous connaissez ces deux nombres, vous savez tout ce que vous devez savoir sur la forme de votre courbe.

En retournant cette idée, les distributions normales nous donnent également un bon moyen d’interpréter les écarts types. Dans toute distribution normale, il existe des probabilités fixes pour les intervalles autour de la moyenne, basées sur des multiples de l’écart-type de la distribution.

En particulier, environ deux tiers des mesures d’une quantité normalement distribuée devraient se situer dans un écart-type de la moyenne, 95% des mesures dans deux écarts-type de la moyenne, et 99.7% dans les limites de trois écarts types de la moyenne.

Cette illustration de la courbe normale répertorie ces valeurs :

Dan Kernler, via Wikimedia Commons

Supposons qu’il existe un test standardisé que des centaines de milliers d’étudiants passent. Si les questions du test sont bien conçues, les scores des étudiants devraient être à peu près normalement distribués. Supposons que la note moyenne du test soit de 100, avec un écart-type de 10 points. La règle mentionnée ci-dessus signifie qu’environ deux tiers des élèves devraient avoir des scores compris entre 90 et 110, 95 % des élèves devraient se situer entre 80 et 120, et presque tous les élèves – 99,7 % – devraient avoir des scores situés dans les trois écarts types de la moyenne.

Des questions ?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.