Risposte AI più precise

Un nuovo algoritmo del Politecnico di Zurigo sta rivoluzionando l'uso di modelli linguistici di grandi dimensioni. Con dati specificamente selezionati, le risposte dell'AI diventano più affidabili e lo sforzo di calcolo si riduce in modo significativo.
I grandi modelli linguistici affascinano con la loro conoscenza e allo stesso tempo irritano con risposte imprecise o contraddittorie. La ragione di ciò risiede spesso nell’incertezza dei modelli, che finora era difficile da controllare. I ricercatori del Politecnico di Zurigo hanno ora sviluppato l’algoritmo SIFT (“Selecting Informative data for Fine-Tuning”), un metodo che affronta proprio questo problema. Seleziona i dati aggiuntivi proprio in base alla riduzione dell’incertezza e al miglioramento della qualità della risposta.
Selezione delle informazioni attraverso analisi vettoriali
Invece di utilizzare semplicemente le informazioni più vicine, SIFT analizza la struttura di relazione delle informazioni linguistiche nello spazio multidimensionale dei grandi modelli. Il fattore decisivo è l’angolo tra i vettori. Le informazioni con contenuti complementari vengono selezionate in modo specifico per fornire risposte complete e pertinenti. Le ridondanze e le sovrapposizioni, che si verificano negli approcci classici, vengono sistematicamente evitate.
Grande impatto anche con modelli piccoli
L’arricchimento mirato con dati rilevanti consente di ridurre drasticamente lo sforzo computazionale di modelli linguistici di grandi dimensioni. Nei test, SIFT-tuning ha persino superato i potenti modelli AI con modelli fino a 40 volte più piccoli. Allo stesso tempo, il sistema si adatta dinamicamente. Durante l’uso, il modello arricchito diventa sempre più preciso, in quanto continua ad allenarsi durante il funzionamento.
Valutazione della rilevanza per altre aree di applicazione
SIFT offre anche un prezioso vantaggio aggiuntivo. Analizzando quali dati sono riconosciuti come particolarmente rilevanti, si possono identificare correlazioni importanti in aree specialistiche come la medicina, la ricerca o l’industria. Ad esempio, i dati diagnostici particolarmente significativi possono essere filtrati in modo efficiente.