Un paper di Google Research e Università di Edimburgo dimostra l'efficacia di un algoritmo di IA in grado di riassumere un intero documento in una sola, breve frase

Una ricerca pubblicata sul Journal of Artificial Intelligence Research definisce i “riassunti estremi” (extreme summarization) come compiti di sintesi basati intelligenza artificiale che agiscono su un singolo documento generando un riassunto di una sola, breve frase, che risponde alla seguente domanda: “di cosa parla questo articolo”?

Le tradizionali tecniche impiegate per riassumere automaticamente testi lunghi si basano principalmente su tecniche estrattive: vengono prelevate porzioni del documento che l’algoritmo ritiene più rilevanti e sintetiche di altre. Questo approccio può essere efficace per ridurre la lunghezza di un testo fino a una certa percentuale, ma non è adeguato alla extreme summarization, in cui si vuole ottenere come risultato una sola frase sintetica, e che richiede quindi l’utilizzo della modellazione astrattiva.

I ricercatori hanno raccolto un vasto dataset formato da articoli della BBC e dal loro riassunto e proposto un nuovo modello astrattivo contestualizzato sull’argomento dell’articolo e interamente basato su reti neurali convoluzionali.

Questa architettura è stata in grado di individuare dipendenze tra parti del documento lontane tra loro e riconoscere i contenuti pertinenti superando in efficacia tanto i sistemi estrattivi quanto gli approcci astrattivi preesistenti.

Colleghi giornalisti che state alzando il sopracciglio con un’espressione tra il diffidente e il preoccupato: vi sono vicino.

Il paper “What is This Article About? Extreme Summarization with Topic-Aware Convolutional Neural Networks”, firmato da Shashi Narayan di Google Research e Shay B. Cohen e Mirella Lapata dell’Università di Edimburgo è disponibile gratuitamente a questo indirizzo.