Un grafico a dispersione è un insieme di punti tracciati su un asse orizzontale e verticale.
I grafici a dispersione sono importanti nelle statistiche perché possono mostrare l'entità della correlazione, se esiste, tra i valori delle quantità o dei fenomeni osservati (chiamati variabili). Se non esiste alcuna correlazione tra le variabili, i punti appaiono sparsi in modo casuale sul piano delle coordinate. Se esiste una grande correlazione, i punti si concentrano vicino a una linea retta. I grafici a dispersione sono utili strumenti di visualizzazione dei dati per illustrare una tendenza.
Oltre a mostrare l'entità della correlazione, un grafico a dispersione mostra il senso della correlazione:
- Se la verticale (o y-axis) aumenta all'aumentare della variabile orizzontale (o x-asse) aumenta la variabile, la correlazione è positiva.
- Se l' y-la variabile dell'asse diminuisce all'aumentare del valore x-axis variabile aumenta o viceversa, la correlazione è negativa.
- Se è impossibile stabilire uno dei criteri di cui sopra, la correlazione è zero.
La massima correlazione positiva possibile è +1 o + 100%, quando tutti i punti in un grafico a dispersione si trovano esattamente lungo una linea retta con una pendenza positiva. La massima correlazione negativa possibile è -1 o -100%, nel qual caso tutti i punti giacciono esattamente lungo una linea retta con pendenza negativa.
La correlazione viene spesso confusa con la causalità, accidentalmente (come risultato di ipotesi false o non dimostrate) o deliberatamente (con l'intento di ingannare). Tuttavia, in senso puro, mentre un grafico a dispersione può rivelare la natura e l'entità della correlazione, non dice nulla sulla causalità.
Vedere anche: teoria dei grafi, pittogramma, grafico a barre, grafico punto a punto, sparkline, grafico delle serie temporali