L'apprendimento attivo, in un contesto di intelligenza artificiale, è la capacità di un algoritmo di apprendimento automatico (ML) di interrogare una fonte umana per ulteriori informazioni. In sostanza, l'apprendimento attivo consente a un programma di intelligenza artificiale con formazione minima di identificare i dati di cui ha bisogno per migliorare. TL'algoritmo identifica quale sottoinsieme di dati si aspetta produca i migliori risultati per una particolare categoria e richiede che qualcuno etichetti i dati in quel sottoinsieme.
Gli algoritmi di apprendimento attivo richiedono dati di addestramento minimi, il che li rende particolarmente utili quando non sono disponibili molti dati etichettati. Ciò rende questo tipo di algoritmo utile per il recupero delle informazioni e l'analisi del testo, nonché per il riconoscimento di immagini e voce.
Apprendimento attivo vs apprendimento supervisionato vs apprendimento non supervisionato
Gli algoritmi di apprendimento attivo sono una forma semplice di intelligenza artificiale semi-supervisionata e curiosa. Questo tipo di algoritmo combina aspetti dell'apprendimento supervisionato e dell'apprendimento non supervisionato.
Il ML supervisionato, che utilizza i dati storici per fare previsioni sui nuovi dati, richiede che un essere umano crei dati di input e output desiderati per l'addestramento. Poiché questo approccio richiede molte spese generali umane, può essere costoso. Al contrario, i sistemi di intelligenza artificiale che utilizzano l'apprendimento non supervisionato richiedono pochissimo sovraccarico umano perché gli algoritmi cercano semplicemente modelli in set di dati senza etichetta. Sebbene questo tipo di ML possa essere conveniente perché non richiede tanto input umano, può anche essere difficile quantificare i risultati come significativi.
L'apprendimento attivo può utilizzare dati strutturati e non strutturati in modo efficiente in termini di costi, dando la priorità ai dati su cui il modello è più confuso e richiedendo etichette solo per quei dati. Il modello utilizzerà una quantità relativamente piccola di dati etichettati per l'addestramento e richiederà più etichette in seguito, se necessario. Questo approccio iterativo all'apprendimento automatico non solo aiuta il modello di apprendimento automatico ad apprendere più velocemente, ma mantiene bassi i costi consentendo agli umani di saltare l'etichettatura dei dati che non sono utili al modello.
Guarda questo tutorial introduttivo sull'apprendimento attivo per saperne di più.