Il rumore statistico è una variabilità inspiegabile all'interno di un campione di dati. Il termine rumore, in questo contesto, deriva dall'elaborazione del segnale in cui era usato per riferirsi a energia elettrica o elettromagnetica indesiderata che degrada la qualità dei segnali e dei dati. La presenza di rumore significa che i risultati del campionamento potrebbero non essere duplicati se il processo fosse ripetuto.
I dati rumorosi sono dati resi privi di significato dall'esistenza di troppe variazioni. Si presume che il segnale (dati deterministici o significativi) sia presente ma oscurato dal rumore (dati casuali). Inizialmente considerato come riferimento a dati corrotti, i dati rumorosi ora si riferiscono a tutti i dati che non sono leggibili dalla macchina. In quanto tale, include testo non strutturato e tutti i dati che sono stati alterati in qualche modo da non essere più compatibili con il programma utilizzato per crearlo.
Il problema di separare il rumore dal segnale è stato a lungo al centro delle statistiche, in modo che i dati significativi potessero informare i ricercatori. Spesso, tuttavia, la porzione di dati rumorosi che è significativa è troppo piccola per essere utile.
In un contesto non scientifico, le persone spesso usano il termine rumore statistico per ignorare i dati che non li soddisfano o non sono conformi alle loro aspettative.