PRIMO PASSO VERSO UN MADE IN ITALY. AD ANNUNCIARLO L´ UNIVERSITA´ LA SAPIENZA DI ROMA. L´ I.A. MIGLIORA LA PRODUTTIVITA´AZIENDALE
Il 23 Aprile l´Universita´la Sapienza di Roma ha annnciato Minerva , una nuova famiglia di modelli linguistici su larga scala, addestrati da zero per la lingua italiana. Si tratta di un progetto guidato dal Consiglio Nazionale delle Ricerche che realizza la strategia nazionale sll´intelligenza artificiale grazie ai fondi PNRR in collaborazione con CINECA, che ha reso disponibile il supercomputer Leonardo. Per la prima volta, anche l’Italia, avrà i suoi modelli linguistici addestrati da zero, usando testi nella nostra lingua. Si tratta di una piccola-grande rivoluzione, perché ad oggi tutti i sistemi che si basano su applicazioni di Intelligenza Artificiale, derivano da modelli linguistici che parlano normalmente l´inglese come lingua di comunicazione. Minerva, invece, è il primo modello che ha imparato l’italiano da un enorme insieme di fonti aperte: oltre 500 miliardi di parole dal mondo web, qualcosa come 5 milioni di romanzi. Gli autori sono un gruppo di giovani ricercatori dell’Università La Sapienza di Roma, con la collaborazione del supercomputer Leonardo di Cineca, necessario per l’elaborazione dei Big Data.
.
I modelli linguistici sono software di Intelligenza Artificiale
che hanno come obiettivo primario quello di produrre un testo, una parola, una frase che con maggior probabilità seguirebbero all’input fornito: la definizione è modello linguistico “fondazionale”. Il modello “fondazionale” non deve saper fare riassunti o traduzioni automatiche, ma è il passaggio precedente ai modelli addestrati a ricevere istruzioni e a eseguirle, a fornire risposte a domande, come ChatGpt. La grande innovazione di Minerva è che il suo gruppo è partito da zero, senza alcun modello preesistente ed è il primo sforzo di questo tipo, reso possibile dall’impegno che 15 ricercatori hanno dedicato al progetto, ma deve essere chiara la differenza tra il modello funzionale e quello istruito, altrimenti le persone si aspettano un ChatGpt italiano, ma non è questo lo scopo del progetto. Minerva è stato istruito con parole del web, che è il più grande corpus di documenti di testi esistenti al mondo disponibili in modo aperto e gratuito. Per il nostro Paese avere a disposizione un modello linguistico italiano permette ad altri ricercatori o aziende italiane di sviluppare applicazioni specifiche.
Ci saranno ulteriori sviluppi per Minerva creato come un modello esclusivamente mirato alla creazione automatica di riassunti di notizie che potrebbero essere utili alle aziende. Inoltre, si e´al lavoro anche sulla traduzione automatica senza trascurare l’idea di un modello in grado di fare conversazione come ChatGpt, ma ci sono ancora dei problemi da superare. Si tratta di un importante passo in avanti per le aziende che mirano a migliorare sempre piu´sotto l´aspetto tecnologico per il raggiungimento di particolari obiettivi migliorandone la produttivita´e l´efficienza, portando ad aumentare i profitti ed i posti di lavoro.