Există metode prin care se verifică dacă există valori aberante în disciplina statisticii și a analizei statistice. Valorile aberante ar putea fi un rezultat al unei schimbări de locație (medie) sau de scară (variabilitate) a procesului de interes. Valorile aberante ar putea fi, de asemenea, o dovadă a unei populații eșantionate care are o distribuție nenormală sau a unui set de date de populație contaminat. În consecință, așa cum este ideea de bază a statisticii descriptive, atunci când întâlnim o valoare aberantă, trebuie să explicăm această valoare printr-o analiză suplimentară a cauzei sau a originii valorii aberante. În cazul observațiilor extreme, care nu sunt un eveniment rar, trebuie analizate valorile tipice. În cazul cuartilelor, intervalul interquartil (IQR) poate fi utilizat pentru a caracteriza datele atunci când pot exista extremități care denaturează datele; intervalul interquartil este o statistică relativ robustă (denumită uneori și „rezistență”) în comparație cu intervalul și abaterea standard. Există, de asemenea, o metodă matematică de verificare a valorilor aberante și de determinare a „gardurilor”, limite superioare și inferioare de la care se verifică dacă există valori aberante.
După determinarea primului și celui de-al treilea cuartil și a intervalului interquartil, așa cum s-a subliniat mai sus, se calculează gardurile folosind următoarea formulă:
Gardul inferior = Q 1 – 1.5 ( I Q R ) {\displaystyle {\text{Curtea inferioară}}=Q_{1}-1,5(\mathrm {IQR} )\,}
Curtea superioară = Q 3 + 1,5 ( I Q R ) , {\displaystyle {\text{Curtea superioară}}=Q_{3}+1.5(\mathrm {IQR} ),\,}
unde Q1 și Q3 sunt prima și, respectiv, a treia cuartilă. Gardul inferior reprezintă „limita inferioară” și gardul superior reprezintă „limita superioară” a datelor, iar orice date aflate în afara acestor limite definite pot fi considerate aberante. Orice lucru aflat sub gardul inferior sau deasupra gardului superior poate fi considerat un astfel de caz. Gardurile oferă o linie directoare prin care se definește un outlier, care poate fi definit în alte moduri. Gardurile definesc un „interval” în afara căruia există o valoare aberantă; o modalitate de a ne imagina acest lucru este o limită a unui gard, în afara căruia se află „outsideri”, spre deosebire de valorile aberante. Se obișnuiește ca gardurile inferioare și superioare, împreună cu valorile aberante, să fie reprezentate de un boxplot. Pentru un boxplot, doar înălțimile verticale corespund setului de date vizualizat, în timp ce lățimea orizontală a casetei este irelevantă. Valorile aberante situate în afara gardurilor într-un boxplot pot fi marcate cu orice simbol la alegere, cum ar fi un „x” sau un „o”. Gardurile sunt uneori denumite și „mustăți”, în timp ce întreaga vizualizare a graficului se numește grafic „box-and-whisker”.
Când se detectează o valoare aberantă în setul de date prin calcularea intervalelor interquartile și a caracteristicilor boxplot, ar putea fi simplu să se considere în mod eronat că este o dovadă că populația nu este normală sau că eșantionul este contaminat. Cu toate acestea, această metodă nu ar trebui să înlocuiască un test de ipoteză pentru determinarea normalității populației. Semnificația valorilor aberante variază în funcție de mărimea eșantionului. Dacă eșantionul este mic, atunci este mai probabil să se obțină intervale interquartile care sunt nereprezentativ de mici, ceea ce duce la garduri mai înguste. Prin urmare, ar fi mai probabil să se găsească date care sunt marcate ca fiind aberante.
.