Det finns metoder för att kontrollera om det finns outliers inom statistik och statistisk analys. Outliers kan vara ett resultat av en förskjutning av platsen (medelvärdet) eller av skalan (variabiliteten) för den aktuella processen. Utfall kan också vara tecken på att en provpopulation har en icke-normal fördelning eller på en kontaminerad populationsdatasats. När vi stöter på ett avvikande värde måste vi följaktligen, vilket är den grundläggande idén med deskriptiv statistik, förklara detta värde genom ytterligare analys av orsaken eller ursprunget till avvikelsen. Vid extrema observationer, som inte är ovanliga, måste de typiska värdena analyseras. När det gäller kvartiler kan interkvartilintervallet (IQR) användas för att karakterisera data när det kan finnas extremiteter som snedvrider data; interkvartilintervallet är en relativt robust statistik (ibland även kallad ”motståndskraft”) jämfört med intervallet och standardavvikelsen. Det finns också en matematisk metod för att kontrollera om det finns outliers och bestämma ”fences”, övre och nedre gränser från vilka man kan kontrollera om det finns outliers.
Efter att ha bestämt den första och tredje kvartilen och det interkvartila intervallet enligt ovan, beräknas sedan fences med hjälp av följande formel:
Nedre fence = Q 1 – 1.5 ( I Q R ) {\displaystyle {\text{Berre fence}}=Q_{1}-1.5(\mathrm {IQR} )\,}
Övre fence = Q 3 + 1.5 ( I Q R ) , {\displaystyle {\text{Övre fence}}=Q_{3}+1.5(\mathrm {IQR} ),\,}
där Q1 och Q3 är den första respektive tredje kvartilen. Det nedre staketet är den ”nedre gränsen” och det övre staketet är den ”övre gränsen” för data, och alla data som ligger utanför dessa definierade gränser kan betraktas som en outlier. Allt som ligger under det nedre staketet eller över det övre staketet kan betraktas som ett sådant fall. Gränserna utgör en riktlinje för att definiera en outlier, som kan definieras på andra sätt. Genom staketet definieras ett ”område” utanför vilket en outlier existerar; ett sätt att föreställa sig detta är en staketgräns, utanför vilken det finns ”outsiders” i motsats till outliers. Det är vanligt att de nedre och övre gränserna tillsammans med outliers representeras av en boxplot. För en boxplot motsvarar endast de vertikala höjderna den visualiserade datamängden medan boxens horisontella bredd är irrelevant. Utfall som ligger utanför stängslet i en boxplot kan markeras med valfri symbol, t.ex. ett ”x” eller ett ”o”. Staketet kallas ibland också för ”whiskers” medan hela den visuella plotten kallas för en ”box-and-whisker”-plott.
När man upptäcker en outlier i datamängden genom att beräkna interkvartilintervallet och boxplot-funktionerna, kan det vara enkelt att felaktigt betrakta det som ett bevis på att populationen är icke-normal eller att urvalet är kontaminerat. Denna metod bör dock inte ersätta ett hypotestest för att fastställa populationens normalitet. Betydelsen av outliers varierar beroende på stickprovets storlek. Om urvalet är litet är det mer sannolikt att man får interkvartilområden som inte är representativt små, vilket leder till smalare staket. Därför skulle det vara mer sannolikt att hitta data som markeras som outliers.