Per la prima volta sistemi di intelligenza artificiale hanno battuto l’uomo in un test di comprensione della lettura. Il risultato è stato raggiunto dai due modelli AI sviluppati da Microsoft e Alibaba, che si sono classificati ai primi posti del test Stanford Question Answering Dataset (SQuAD). Il test consiste in una serie di domande alle quali è possibile trovare risposta in oltre 500 voci di Wikipedia.

Il modello di rete neurale profonda del Data Science and Technologies (iDST) di Alibaba ha ottenuto il punteggio 82.440 nella parte di “ExactMatch” del test, superando il punteggio di 82.304 raggiunto dall’uomo. Il modello del gruppo Microsoft Research Asia ha raggiunto un punteggio di 82.650.

Il test viene effettuato da diverse aziende che effettuano ricerche in intelligenza artificiale, tra le quali Google, IBM Research, Facebook AI Research, Salesforce Research, Tencent e Samsung.

Alibaba e Microsoft compaiono prime a pari merito nella classifica, sebbene entrambe le società affermino di aver raggiunto per prime un risultato migliore dell’essere umano.

Secondo la classifica ufficiale Microsoft ha raggiunto il suo punteggio il 3 gennaio e Alibaba due giorni dopo. Alibaba ha tuttavia precisato che le date si riferiscono a quando le società hanno presentato i loro modelli, non a quando sono stati effettivamente raggiunti i risultati dei test.

È per noi un grande onore rappresentare la pietra miliare in cui le macchine superano gli umani nella comprensione della lettura”, ha dichiarato Luo Si, a capo del gruppo per l’elaborazione del linguaggio naturale (NLP, Natural Language Processing) presso l’Institute of Data Science and Technologies di Alibaba. “Siamo entusiasti di vedere che la ricerca sul NLP ha compiuto progressi significativi nel corso dell’anno. Non vediamo l’ora di condividere il nostro metodo di sviluppo dei modelli con la comunità più ampia ed esportare la tecnologia ai nostri clienti nel prossimo futuro”.

Ming Zhou, vice direttore generale di Microsoft Research Asia, ha affermato che, nonostante la pietra miliare, nel complesso gli esseri umani sono ancora migliori delle macchine nel comprendere la complessità e le sfumature del linguaggio.

L’elaborazione del linguaggio naturale è un’area che pone ancora molte sfide e in cui tutti dobbiamo investire”, ha detto Zhou. “Il traguardo raggiunto è solo l’inizio”.

Alibaba ha dichiarato di aver utilizzato per diversi anni la tecnologia sottostante il sistema durante il suo “Global Shopping Festival” per rispondere alle richieste dei clienti.

Microsoft ha spiegato che le versioni precedenti del modello sono state utilizzate per il suo motore di ricerca Bing.

Questi strumenti potrebbero anche consentire a medici, avvocati e altri esperti di svolgere in breve tempo compiti come la lettura di documenti di grandi dimensioni per risultati medici specifici o precedenti legali”, ha scritto la società in un post. “La tecnologia può potenziare il loro lavoro lasciando loro più tempo per applicare le conoscenze e concentrarsi sul trattamento dei pazienti o sulla formulazione di opinioni legali”.