Una matrice di confusione è una tabella che delinea diverse previsioni e risultati dei test e li mette in contrasto con i valori del mondo reale. Le matrici di confusione vengono utilizzate nelle statistiche, nel data mining, nei modelli di machine learning e in altre applicazioni di intelligenza artificiale (AI). Una matrice di confusione può anche essere chiamata matrice di errore.
Le matrici di confusione vengono utilizzate per rendere l'analisi approfondita dei dati statistici più veloce e i risultati più facili da leggere attraverso una chiara visualizzazione dei dati. Le tabelle possono aiutare ad analizzare i guasti nelle statistiche, nel data mining, nelle analisi forensi e nei test medici. Un'analisi approfondita aiuta gli utenti a decidere quali risultati indicano come vengono commessi gli errori piuttosto che limitarsi a valutare le prestazioni.
Le matrici di confusione utilizzano un formato semplice per registrare le previsioni. Nelle righe di una matrice di confusione per un modello di apprendimento automatico, le possibili previsioni sono allineate a destra e le realtà in alto. Nelle righe sottostanti vengono registrate le attualità, le previsioni o i risultati. I risultati possono includere l'indicazione corretta di un positivo come vero positivo o di un negativo come vero negativo, nonché di un positivo errato come falso positivo o di un negativo errato come falso negativo.
Di seguito è riportato un semplice esempio di una matrice di confusione che potrebbe essere utilizzata per delineare i risultati del test di gravidanza:
Le matrici di codifica a colori consentono di leggere rapidamente un numero di istanze in un test. La visualizzazione rapida consente di analizzare le prestazioni di un determinato modello in modo più approfondito rispetto a un punteggio e di identificare le tendenze che potrebbero aiutare a modificare i parametri.