La discendenza dei dati è la storia dei dati, incluso il luogo in cui i dati hanno viaggiato per tutta la loro esistenza all'interno di un'organizzazione. La derivazione dei dati è una parte obbligatoria della conformità alle policy dei dati aziendali e governative. Il monitoraggio della cronologia dei dati si ottiene tramite la documentazione e il software della derivazione dei dati. Senza un modo per identificare dove vengono introdotti errori di dati nell'ambiente, è difficile per i data steward identificare e risolvere i problemi di qualità dei dati.
Con strumenti efficaci, la governance dei dati può essere facilitata attraverso la documentazione dell'intero viaggio dei dati attraverso l'organizzazione. La documentazione della derivazione dei dati aiuta a semplificare due delle principali preoccupazioni di governance dei dati per gli effetti dei cambiamenti nei dati: analisi della causa principale e analisi dell'impatto aziendale (BIA). Una chiara comprensione delle cause profonde e degli impatti dei problemi con i dati è aiutata dalla conoscenza di tutto ciò che è accaduto ai dati da quando sono diventati.
Nello sviluppo del software, il monitoraggio della discendenza dei dati può aiutare a conciliare le difficoltà tra le migliori pratiche di sviluppo Agile, le normative sulla governance dei dati e la politica dei dati aziendali. Gli strumenti e le procedure di derivazione dei dati aiutano a tenere traccia dei punti in cui sono stati introdotti i difetti dei dati, facilitando la diagnosi e la correzione. L'implementazione del tracciamento della derivazione dei dati può essere difficile e spesso vista come una priorità bassa, tuttavia, una correzione anticipata significa una minore propagazione degli errori, il che significa che l'implementazione degli strumenti di derivazione dei dati nelle prime fasi del processo spesso si rivela degno dello sforzo.