L’elaborazione del linguaggio naturale (NLP) è la branca dell’intelligenza artificiale che si occupa di addestrare un computer a comprendere, elaborare e generare linguaggio. I motori di ricerca, i servizi di traduzione automatica e gli assistenti vocali sono tutti alimentati da questa tecnologia.

Sebbene il termine originariamente si riferisse alla capacità di lettura di un sistema, da allora è diventato un linguaggio colloquiale per tutta la linguistica computazionale. Le sottocategorie includono la generazione del linguaggio naturale (NLG), la capacità di un computer di creare la propria comunicazione e la comprensione del linguaggio naturale (NLU), la capacità di comprendere gergo, errori di pronuncia, errori di ortografia e altre varianti del linguaggio.

Come funziona l’elaborazione del linguaggio naturale

La NLP funziona tramite machine learning (ML). I sistemi ML memorizzano le parole e il modo in cui si uniscono come qualsiasi altra forma di dati. Frasi e talvolta interi libri vengono inseriti nei motori ML dove vengono elaborati utilizzando regole grammaticali, abitudini linguistiche della vita reale delle persone o entrambi. Il computer utilizza quindi questi dati per trovare schemi ed estrapolare ciò che viene dopo. Prendiamo ad esempio il software di traduzione: in francese, Vado al parco si dice Je vais au parc; a questo punto il machine learning prevede che anche la frase Vado al negozio inizierà con Je vais au. Tutto ciò di cui il computer ha bisogno è la parola negozio.

Applicazioni NLP

La traduzione automatica è un’applicazione NLP molto nota, ma la ricerca è l’applicazione di gran lunga più utilizzata. Ogni volta che cercate qualcosa in Google o Bing, state inserendo dati nel sistema. Quando si fa clic su un risultato di ricerca, il sistema lo interpreta come una conferma che i risultati trovati sono corretti e utilizza queste informazioni per una migliore ricerca in futuro.

I chatbot funzionano allo stesso modo: si integrano con Slack, Microsoft Messenger e altri programmi di chat in cui leggono la lingua che usate, quindi si attivano quando digitate una frase di attivazione. Anche gli assistenti vocali come Siri e Alexa si attivano quando sentono frasi come Ehi, Siri. Ecco perché i critici dicono che questi programmi sono sempre in ascolto: se non lo fossero, non saprebbero mai quando ne avete bisogno. A meno che non si attivi manualmente un’app, i programmi NLP devono funzionare in background, in attesa di percepire quella frase.

Esempi di elaborazione del linguaggio naturale

I dati sono disponibili in molte forme, ma il più grande pool di dati non sfruttato è costituito dal testo. Brevetti, specifiche di prodotto, pubblicazioni accademiche, ricerche di mercato, notizie, per non parlare dei feed dei social media, hanno tutti il testo come componente principale e il volume del testo è in costante crescita. Applicate la tecnologia alla voce e il pool diventa ancora più grande. Ecco tre esempi di come le organizzazioni stanno utilizzando la tecnologia NLP:

Accenture la utilizza per analizzare i contratti: lo strumento Accenture Legal Intelligent Contract Exploration (ALICE) aiuta l'organizzazione legale della società di servizi globale di 2.800 professionisti a eseguire ricerche di testo su oltre milioni di contratti, comprese le ricerche di clausole contrattuali. ALICE utilizza l'"incorporamento di parole" per esaminare i documenti del contratto paragrafo per paragrafo, cercando parole chiave per determinare se il paragrafo si riferisce a un particolare tipo di clausola contrattuale.

Software di elaborazione del linguaggio naturale

Sia che stiate creando un chatbot, un assistente vocale, un’applicazione di testo predittivo o un’altra applicazione con la NLP al centro, avrete bisogno di strumenti specifici. Secondo i centri di valutazione tecnologica, i software più popolari sono:

Natural Language Toolkit (NLTK). NLTK è un framework open source per la creazione di programmi Python per lavorare con dati in linguaggio umano. È stato sviluppato dal Dipartimento di Informatica e Scienza dell'Informazione presso l'Università della Pennsylvania e fornisce interfacce a più di 50 risorse lessicali, una suite di librerie di elaborazione del testo, wrapper per librerie di elaborazione del linguaggio naturale e un forum di discussione. NLTK è offerto con la licenza Apache 2.0.

Corsi di elaborazione del linguaggio naturale

Ci sono molte risorse disponibili per imparare a creare e mantenere applicazioni NLP e alcune di esse sono gratuite.

Introduction to Natural Language Processing in Python di DataCamp. Questo corso gratuito, offerto in 15 video e 51 esercizi, copre le basi della NLP usando Python, incluso come identificare e separare le parole, come estrarre argomenti in un testo e come costruire il vostro classificatore di fake news.

Parte della specializzazione avanzata in Machine Learning di Coursera, questo corso copre attività di elaborazione del linguaggio naturale tra cui analisi del sentiment, riepilogo, monitoraggio dello stato del dialogo e altro ancora. Si tratta di un corso di livello avanzato e occorrono circa cinque settimane di studio da quattro a cinque ore settimanali per completarlo. Natural Language Processing in TensorFlow di Coursera. Questo corso fa parte della specializzazione TensorFlow in Practice di Coursera e copre l’utilizzo di TensorFlow per creare sistemi di elaborazione del linguaggio naturale in grado di elaborare testo e frasi di input in una rete neurale. Coursera specifica che si tratta di un corso di livello intermedio e stima che ci vorranno quattro settimane di studio da quattro a cinque ore a settimana per completarlo.