Il Deep Web, a volte chiamato il Web invisibile, è la gran parte di Internet inaccessibile ai motori di ricerca convenzionali. I contenuti Deep Web includono messaggi di posta elettronica, messaggi di chat, contenuti privati su siti di social media, estratti conto bancari elettronici, cartelle cliniche elettroniche (EHR) e altri contenuti accessibili su Internet ma non sottoposti a scansione e indicizzati da motori di ricerca come Google, Yahoo, Bing o DuckDuckGo.
Le ragioni per non indicizzare i contenuti del Deep Web sono molteplici. È possibile che il contenuto sia proprietario, nel qual caso il contenuto è accessibile solo ai visitatori approvati che entrano attraverso una rete privata virtuale (VPN). Oppure il contenuto può essere commerciale, nel qual caso il contenuto risiede dietro la bacheca di un membro e può essere consultato solo dai clienti che hanno pagato una quota. O forse il contenuto contiene informazioni di identificazione personale (PII), nel qual caso il contenuto è protetto dalle normative di conformità ed è possibile accedervi solo tramite un sito portale da persone a cui sono stati concessi privilegi di accesso. Quando i mashup sono stati generati al volo e i componenti non dispongono di un URL (Uniform Resource Location) permanente, diventano anche parte del Deep Web.
Non si sa quanto sia grande il Deep Web, ma molti esperti stimano che i motori di ricerca eseguano la scansione e indicizzano meno dell'1% di tutto il contenuto a cui è possibile accedere tramite Internet. Quella parte di Internet che viene sottoposta a scansione e indicizzata dai motori di ricerca viene talvolta definita Web di superficie. Il termine "deep web" è stato coniato da BrightPlanet in un white paper del 2001 intitolato "The Deep Web: Surfacing Hidden Value" ed è spesso confuso nei media con il termine dark web. Come i contenuti del Deep Web, i contenuti del Dark Web non sono accessibili dai motori di ricerca convenzionali, ma molto spesso il motivo è che il contenuto è illegale.