Il filtraggio collaborativo è il processo predittivo alla base dei motori di raccomandazione. I motori di raccomandazione analizzano le informazioni sugli utenti con gusti simili per valutare la probabilità che un individuo target apprezzerà qualcosa, come un video, un libro o un prodotto. Il filtro collaborativo è noto anche come filtro sociale.
Il filtraggio collaborativo utilizza algoritmi per filtrare i dati dalle recensioni degli utenti per fornire consigli personalizzati per gli utenti con preferenze simili. Il filtro collaborativo viene utilizzato anche per selezionare contenuti e pubblicità per gli individui sui social media.
Tre tipi di filtri collaborativi comunemente usati nei sistemi di raccomandazione sono basati sui vicini, elemento per elemento e basati sulla classificazione.
Nel filtro basato sui vicini, gli utenti vengono selezionati in base alla loro somiglianza con l'utente attivo. Questa somiglianza è determinata dalla corrispondenza degli utenti che hanno pubblicato recensioni simili. Sulla base della precedente somiglianza, si presume che anche le simpatie e le antipatie future saranno simili. Dalla valutazione media del gruppo, vengono forniti consigli per l'utente attivo.
Un processo di filtraggio da elemento a elemento utilizza una matrice per determinare la somiglianza di coppie di elementi. I processi da elemento a elemento confrontano quindi la preferenza dell'utente corrente con gli elementi nella matrice per somiglianze su cui basare le raccomandazioni.
Un sistema di filtraggio collaborativo basato sulla classificazione consiglia le cose in base a come gli utenti simili hanno apprezzato quella classificazione o genere. Si presume che gli utenti a cui piacciono o non piacciono esperienze simili all'interno di una classificazione apprezzeranno anche gli altri all'interno di quella classificazione.
Alcuni sistemi di filtraggio collaborativo sono basati sulla memoria, come i modelli adiacenti e da elemento a elemento, che confrontano le somiglianze di utenti o elementi. Altri sono basati su modelli e utilizzano l'apprendimento automatico per confrontare elementi dissimili. I sistemi basati su modelli possono utilizzare algoritmi come il processo decisionale di Markov per prevedere le valutazioni per gli elementi che non sono stati ancora esaminati. I sistemi ibridi includono funzionalità di filtraggio basato sulla memoria e sul modello.
I sistemi di raccomandazione vengono utilizzati per fornire suggerimenti per tutti i tipi di siti Web e servizi. Tuttavia, possono incontrare una serie di difficoltà. La scarsità di valutazioni è uno dei principali ostacoli all'utilità del filtraggio collaborativo nei sistemi con molti elementi. Anche i nuovi elementi tendono ad essere difficili da fornire raccomandazioni. Con i nuovi sistemi di raccomandazione, è difficile fornire buoni consigli prima che un numero sufficiente di utenti abbia inserito recensioni. Allo stesso tempo, tuttavia, troppe valutazioni degli utenti possono essere difficili per alcuni sistemi perché creano enormi set di dati.