Una query in linguaggio naturale è un input costituito esclusivamente da termini o frasi pronunciati normalmente o inseriti come potrebbero essere pronunciati, senza caratteri non linguistici, come il simbolo più o l'asterisco, e senza alcun formato speciale o alterazione della sintassi. Le query in linguaggio naturale possono essere condotte tramite un'interfaccia testuale o vocale.
L'elaborazione del linguaggio naturale (PNL) consente al software di "comprendere" il tipico linguaggio umano o il contenuto scritto come input e possibilmente rispondere ad esso, a seconda dell'applicazione. Un assistente virtuale, ad esempio, è progettato per rispondere a input vocale o testo. Tuttavia, nessun software è in grado di ricavare effettivamente un significato dal linguaggio umano mentre viene parlato, quindi la PNL coinvolge processi per tradurre il linguaggio tra i due.
La PNL applica tecniche di sintassi come l'analisi per un'analisi grammaticale, la segmentazione delle parole per suddividere il testo in unità più piccole, l'interruzione di frasi per applicare confini significativi nel testo ininterrotto, la segmentazione morfologica per identificare la struttura e la forma delle parole e lo stemming, riducendo le parole alle radici a cui si associano suffissi e prefissi. Oltre a questi processi, la PNL utilizza tecniche tra cui il riconoscimento di entità denominate (NER) e la disambiguazione del senso delle parole per comprendere le domande degli utenti di input, tradurle e restituirle come risposte comprensibili dall'uomo attraverso la generazione del linguaggio naturale (NLG).