Er zijn methoden om in de statistiek en statistische analyse te controleren op uitschieters. Uitschieters kunnen een gevolg zijn van een verschuiving in de plaats (gemiddelde) of in de schaal (variabiliteit) van het proces van belang. Uitschieters kunnen ook wijzen op een steekproefpopulatie met een niet-normale verdeling of op een vervuilde populatiegegevensreeks. Bijgevolg moeten wij, zoals het basisidee is van de beschrijvende statistiek, wanneer wij een uitbijter aantreffen, deze waarde verklaren door verdere analyse van de oorzaak of oorsprong van de uitbijter. In het geval van extreme waarnemingen, die niet zelden voorkomen, moeten de typische waarden worden geanalyseerd. In het geval van kwartielen kan de interkwartielafstand (IQR) worden gebruikt om de gegevens te karakteriseren wanneer er extremen kunnen zijn die de gegevens scheeftrekken; de interkwartielafstand is een betrekkelijk robuuste statistiek (ook wel eens “weerstand” genoemd) in vergelijking met de range en de standaardafwijking. Er bestaat ook een wiskundige methode om te controleren op uitschieters en om “hekken” te bepalen, boven- en ondergrenzen van waaruit kan worden gecontroleerd op uitschieters.
Na het bepalen van het eerste en derde kwartiel en de interkwartielafstand zoals hierboven geschetst, worden vervolgens hekken berekend met de volgende formule:
Onderste hekken = Q 1 – 1.5 ( I Q R ) {Displaystyle {{Lage omheining}}=Q_{1}-1.5(\mathrm {IQR} )}
Bovenste omheining = Q 3 + 1.5 ( I Q R ) , {Displaystyle {{Bovenste omheining}}=Q_{3}+1.5(\mathrm {IQR} ),\,}
waarbij Q1 en Q3 respectievelijk het eerste en derde kwartiel zijn. Het onderste hek is de “ondergrens” en het bovenste hek is de “bovengrens” van de gegevens, en alle gegevens die buiten deze gedefinieerde grenzen liggen, kunnen als een uitbijter worden beschouwd. Alles wat onder de ondergrens of boven de bovengrens ligt, kan als een dergelijk geval worden beschouwd. De grenzen zijn een leidraad voor het definiëren van een uitbijter, die ook op andere manieren kan worden gedefinieerd. De hekken definiëren een “bereik” waarbuiten een uitbijter bestaat; een manier om dit voor te stellen is een grens van een hek, waarbuiten zich “outsiders” bevinden in tegenstelling tot uitbijters. Het is gebruikelijk dat de onder- en bovengrenzen samen met de uitschieters door een boxplot worden weergegeven. Bij een boxplot komen alleen de verticale hoogten overeen met de gevisualiseerde gegevensreeks, terwijl de horizontale breedte van het vak irrelevant is. Uitschieters die zich buiten de omheiningen in een boxplot bevinden, kunnen worden gemarkeerd met een symbool naar keuze, zoals een “x” of een “o”. De omheiningen worden soms ook “whiskers” genoemd, terwijl de hele plot visueel een “box-and-whisker”-plot wordt genoemd.
Wanneer men een uitbijter in de gegevensverzameling ontdekt door de interkwartielafstanden en boxplotkenmerken te berekenen, kan het eenvoudig zijn om dit abusievelijk te zien als bewijs dat de populatie niet normaal is of dat de steekproef vervuild is. Deze methode mag echter niet in de plaats komen van een hypothesetest ter bepaling van de normaliteit van de populatie. De betekenis van de uitbijters varieert naar gelang van de steekproefgrootte. Indien de steekproef klein is, is het waarschijnlijker dat men interkwartielbereiken krijgt die niet representatief klein zijn, hetgeen leidt tot smallere uitbijters. Daarom zou het waarschijnlijker zijn gegevens te vinden die als uitbijters worden aangemerkt.