L'analisi aumentata è l'uso dell'apprendimento automatico (ML) e dell'elaborazione del linguaggio naturale (NLP) per migliorare l'analisi dei dati, la condivisione dei dati e la business intelligence. Il concetto di intelligenza aumentata, un concetto generale per l'analisi aumentata, è stato introdotto dalla società di ricerca Gartner, nella loro edizione 2017 del "Hype Cycle for Emerging Technologies".
Il software di analisi dei dati può integrare strumenti di analisi aumentata per gestire set di dati di grandi dimensioni. Le organizzazioni possono immettere informazioni sull'origine dei dati grezzi su queste piattaforme che poi scriveranno, analizzeranno e restituiranno i dati chiave per l'analisi. L'uso dell'apprendimento automatico e della PNL offre agli strumenti di analisi aumentata la capacità di comprendere e interagire con i dati in modo organico, nonché di notare tendenze preziose o insolite.
Il campo dell'analisi dei dati è complesso e generalmente richiede un data scientist per estrarre qualsiasi valore dai big data. Questa complessità è in parte dovuta al fatto che i dati devono essere raccolti da una serie di fonti disparate, come analisi web, comunicati di marketing e post sui social media. La raccolta dei dati è solo il primo passo, deve anche essere preparato per l'analisi essendo organizzato e perfezionato prima che l'analista o il data scientist possa raccogliere informazioni utili. I risultati devono quindi essere comunicati all'organizzazione insieme ai piani d'azione per capitalizzare queste intuizioni.
A causa dello sforzo manuale richiesto per queste attività, i data scientist sono attualmente molto richiesti e possono essere poco costosi per alcune aziende. Si stima che un data scientist possa dedicare fino all'80% del proprio tempo a raccogliere, preparare e ripulire i dati. È qui che è possibile implementare l'analisi aumentata. Con l'aggiunta dell'apprendimento automatico all'analisi dei dati, molte delle attività che richiedono molto tempo per la raccolta e la preparazione dei dati possono essere eseguite rapidamente, automaticamente e con meno errori. Di conseguenza, i data scientist potrebbero dedicare più tempo alla ricerca di informazioni utili.