Un errore di campionamento è un problema nel modo in cui i membri di un file popolazione sono selezionati per la ricerca o raccolta dei dati, che influisce sulla validità dei risultati. Numericamente, un errore di campionamento esprime la differenza tra i risultati per il campione e i risultati stimati per la popolazione.
I soggetti vengono selezionati attraverso diversi metodi, ampiamente classificati come probabilità-basato o non basato sulla probabilità. Si ritiene che i metodi basati sulla probabilità forniscano i risultati più validi perché ogni membro di una popolazione ha le stesse possibilità di selezione; fintanto che sufficientemente grande campione è selezionato, il gruppo dovrebbe essere rappresentativo della popolazione.
Nessun metodo di campionamento è infallibile. Nel semplice campionamento casuale, considerato il metodo più infallibile, i soggetti per il campione vengono selezionati casualmente dall'intera popolazione per creare un sottoinsieme.
Anche in questo caso, tuttavia, la dimensione del campione è un problema. In generale, un gruppo più ampio di soggetti sarà più rappresentativo della popolazione. Immagina, ad esempio, uno studio in cui vengono selezionati trenta soggetti da una popolazione di mille - la selezione casuale non può garantire che il campione rappresenti la popolazione.
Altri errori di campionamento includono:
Mancata risposta: i soggetti potrebbero non rispondere e coloro che rispondono potrebbero differire da quelli che non lo fanno in modo significativo.
Auto-selezione: se i soggetti si offrono volontari, ciò potrebbe indicare che hanno un particolare pregiudizio correlato allo studio, che può distorcere i risultati.
Errore frame campione: come campione può essere selezionato un sottogruppo non rappresentativo.
Errore di specifica della popolazione: il ricercatore non riesce a identificare la popolazione di interesse con sufficiente precisione.
Una dimensione del campione sufficientemente ampia, una selezione randomizzata e l'attenzione al disegno dello studio possono tutti contribuire a migliorare la validità dei dati.