Un disastro basato sui dati è un problema serio causato da uno o più processi di analisi dei dati inefficaci.
Secondo il Data Warehousing Institute, i problemi di qualità dei dati costano alle aziende statunitensi oltre 600 miliardi di dollari all'anno. Oltre all'onere finanziario, i problemi con la qualità e l'analisi dei dati possono avere un grave impatto su sicurezza, conformità, gestione dei progetti e gestione delle risorse umane (HRM), tra le altre possibilità.
L'errore può insinuarsi nell'analisi dei dati in qualsiasi fase. Ad esempio, la qualità dei dati potrebbe essere inadeguata. Potrebbe essere incompleto, impreciso, non aggiornato o potrebbe non essere un indicatore affidabile di ciò che si intende rappresentare. L'analisi e l'interpretazione dei dati sono soggette a un numero simile di insidie. Possono esserci fattori di confusione e il metodo matematico può essere difettoso o inappropriato. La correlazione può essere erroneamente considerata per suggerire un nesso di causalità. La significatività statistica può essere erroneamente attribuita quando i dati non la supportano. Anche se i dati e i processi analitici sono validi, i dati possono essere presentati deliberatamente in modo fuorviante per supportare un'agenda.
In un contesto più ampio, i difetti nei processi basati sui dati sono stati responsabili di veri disastri come l'esplosione della navetta spaziale Challenger nel 1986 e l'abbattimento di un Airbus iraniano da parte della USS Vincennes nel 1988.
Poiché le aziende si occupano di enormi aumenti nella quantità di dati raccolti, a volte indicati come big data, c'è un corrispondente aumento nella tendenza verso la gestione delle decisioni guidate dai dati (DDDM). I problemi sorgono quando si applicano risorse insufficienti ai processi di dati e si ripone troppa fiducia nella loro validità. Per prevenire disastri basati sui dati, è fondamentale esaminare continuamente la qualità dei dati e i processi analitici e prestare attenzione al buon senso e persino all'intuizione. Quando i dati sembrano indicare qualcosa che non ha senso logico o sembra semplicemente sbagliato, è il momento di riesaminare i dati di origine ei metodi di analisi.