Ricerca fuzzy

Una ricerca fuzzy è un processo che individua pagine Web che potrebbero essere rilevanti per un argomento di ricerca anche quando l'argomento non corrisponde esattamente alle informazioni desiderate. Una ricerca fuzzy viene eseguita per mezzo di un programma di ricerca fuzzy, che restituisce un elenco di risultati in base alla probabile rilevanza anche se le parole degli argomenti di ricerca e l'ortografia potrebbero non corrispondere esattamente. Le corrispondenze esatte e altamente pertinenti vengono visualizzate nella parte superiore dell'elenco. Possono essere fornite valutazioni di rilevanza soggettiva, solitamente come percentuali.

Un programma di corrispondenza fuzzy può funzionare come un controllo ortografico e un correttore di errori di ortografia. Ad esempio, se un utente digita "Misissippi" in Yahoo o Google (entrambi utilizzano la corrispondenza fuzzy), viene restituito un elenco di risultati insieme alla domanda "Intendevi Mississippi?" Vengono fornite ortografie alternative e parole che hanno lo stesso suono ma sono scritte in modo diverso. Un programma di corrispondenza fuzzy può compensare gli errori di digitazione di input comuni, nonché gli errori introdotti dalla scansione con riconoscimento ottico dei caratteri (OCR) dei documenti stampati. Il programma può restituire hit con contenuto che contiene una parola di base specificata insieme a prefissi e suffissi. Ad esempio, se "pianeta" viene inserito come parola di ricerca, i risultati si verificano per i siti contenenti parole come "protopianeta" o "planetario". Il programma può anche trovare sinonimi e termini correlati, funzionando come un thesaurus online o uno strumento di riferimento incrociato enciclopedico. Nel motore di ricerca Ask Jeeves, se viene inserita la parola "galassia", vengono restituiti risultati come "Fotografia galattica", "Via Lattea" e "Tour dei nove pianeti del sistema solare".

I programmi di corrispondenza fuzzy di solito restituiscono hit irrilevanti oltre a quelli pertinenti. È probabile che si ottengano risultati superflui per termini con più significati, solo uno dei quali è il significato che l'utente intende. Se l'utente ha solo un'idea vaga o generale dell'argomento o non sa esattamente cosa cercare, il rapporto tra hit rilevanti e hit irrilevanti tende a essere basso. (Il rapporto è ancora più basso, tuttavia, quando viene utilizzato un programma di corrispondenza esatta in questa situazione.)

La ricerca fuzzy è molto più potente della ricerca esatta quando viene utilizzata per la ricerca e l'indagine. La ricerca fuzzy è particolarmente utile quando si ricercano termini non familiari, in lingua straniera o sofisticati, la cui ortografia corretta non è ampiamente nota. La ricerca fuzzy può essere utilizzata anche per individuare individui sulla base di informazioni di identificazione incomplete o parzialmente imprecise.