L'inserimento dei dati è il processo di acquisizione e importazione dei dati per l'uso immediato o l'archiviazione in un database. Ingerire qualcosa significa "prendere o assorbire qualcosa".
I dati possono essere trasmessi in streaming in tempo reale o importati in batch. Quando i dati vengono acquisiti in tempo reale, ogni elemento di dati viene importato così come viene emesso dalla sorgente. Quando i dati vengono importati in batch, gli elementi di dati vengono importati in blocchi distinti a intervalli di tempo periodici. Un processo di importazione dei dati efficace inizia dando la priorità alle origini dati, convalidando i singoli file e instradando gli elementi di dati alla destinazione corretta.
Quando esistono numerose fonti di big data in diversi formati (le fonti possono spesso essere centinaia e i formati in dozzine), può essere difficile per le aziende importare dati a una velocità ragionevole ed elaborarli in modo efficiente al fine di mantenere un vantaggio competitivo . A tal fine, i fornitori offrono programmi software personalizzati per ambienti informatici o applicazioni software specifici. Quando l'inserimento dei dati è automatizzato, il software utilizzato per eseguire il processo può includere anche funzionalità di preparazione dei dati per strutturare e organizzare i dati in modo che possano essere analizzati al volo o in un secondo momento da Business Intelligence (BI) e Business Analytics (BA) programmi.