Un valore anomalo è un singolo punto dati che va molto al di fuori del valore medio di un gruppo di statistiche. I valori anomali possono essere eccezioni che stanno anche al di fuori dei singoli campioni di popolazioni. In un contesto più generale, un valore anomalo è un individuo che è notevolmente diverso dalla norma sotto un certo aspetto.
I valori anomali sono un fattore importante nelle statistiche in quanto possono avere un effetto considerevole sui risultati complessivi. In campioni di dimensioni particolarmente piccole, un singolo valore anomalo può influenzare notevolmente le medie e alterare i risultati finali dello studio.
Un valore anomalo può verificarsi a causa della disinformazione di un soggetto, errori nelle risposte di un soggetto o nell'inserimento dei dati. In alcuni casi, è chiaro che i valori anomali dovrebbero essere rimossi come errori. In altri, può dipendere da standard o chiamate di giudizio in cui i valori anomali sono una deviazione naturale.
Gli statistici, che spesso tentano di mitigare l'effetto dei valori anomali, hanno escogitato modi per identificare ciò che rende un valore anomalo. Ad esempio, in un grafico a dispersione in cui i punti dati sono rappresentati graficamente, i valori anomali sono identificabili visivamente. In un box plot, i valori anomali vengono trovati utilizzando le equazioni per trovare se superano le norme definite.
I valori anomali possono talvolta indicare errori o metodi scadenti di raccolta dei campioni. Possono anche indicare un'anomalia o qualcosa di interessante da studiare poiché non è sempre possibile determinare se i valori anomali sono in errore. Sebbene gli effetti dei valori anomali possano alterare i risultati delle statistiche, è raro che vengano completamente rimossi dai risultati senza osservazioni.