La correlazione è una misura statistica che indica la misura in cui due o più variabili fluttuano l'una rispetto all'altra. Una correlazione positiva indica la misura in cui tali variabili aumentano o diminuiscono parallelamente; una correlazione negativa indica la misura in cui una variabile aumenta al diminuire dell'altra.
Un coefficiente di correlazione è una misura statistica del grado in cui le modifiche al valore di una variabile prevedono la modifica del valore di un'altra. Quando la fluttuazione di una variabile prevede in modo affidabile una fluttuazione simile in un'altra variabile, c'è spesso la tendenza a pensare che ciò significhi che il cambiamento in una causa il cambiamento nell'altra. Tuttavia, la correlazione non implica la causalità. Potrebbe esserci, ad esempio, un fattore sconosciuto che influenza entrambe le variabili in modo simile. Distinguere tra correlazione e nesso di causalità può essere prezioso quando si tratta di modelli di dati sui consumatori e fornire informazioni preziose. L'esempio della birra e dei pannolini viene spesso utilizzato per evidenziarlo nel contesto del marketing.
Ecco un esempio: una serie di studi riporta una correlazione positiva tra la quantità di televisione che i bambini guardano e la probabilità che diventino bulli. La copertura dei media spesso cita tali studi per suggerire che guardare molta televisione induce i bambini a diventare bulli. Tuttavia, gli studi riportano solo una correlazione, non un nesso di causalità. È probabile che qualche altro fattore, come la mancanza di supervisione dei genitori, possa essere il fattore influente.