Microsoft, Google e IBM stanno affrontando la difficile sfida di trasferire alle imprese i risultati che hanno ottenuto con le loro ricerche su intelligenza artificiale (AI) e machine learning (ML). In occasione della conferenza MIT Technology Review EmTech Digital di questa settimana, Peter Lee, Vice Presidente della ricerca in AI di Microsoft, ha spiegato come l’azienda di Redmond sta cercando di rispondere a questa sfida.

Nella nostra intervista, Lee mi ha dato la stessa spiegazione che diede al CEO Satya Nadella. Nadella, come ingegnere che per molti hanno si è occupato di ricerca, non aveva bisogno di dettagli sulle tecnologie: come CEO di Microsoft, aveva invece bisogno di capire la strategia utilizzata per gestire il futuro delle industrie verticali affidate alla gestione del gruppo AI di Microsoft. Si tratta di una grande scommessa, che coinvolge 6.000 dipendenti della società e aziende leader di settori come sanità, istruzione, automotive, finanza e retail.

Tre livelli per le opportunità offerte dall’intelligenza artificiale

Come ha fatto con Nadella, anche nel nostro incontro Lee ha suddiviso l’intelligenza artificiale in tre livelli.

Livello 0. E’ il livello in cui il cliente può utilizzare uno dei modelli pre-istruiti di Microsoft, eventualmente aggiungendo categorie specifiche. Per esempio, il cliente utilizza una API di traduzione automatica di Microsoft per tradurre commenti e aggiunge una categoria specifica, come il vocabolario della moda femminile – è quanto ha fatto eBay per favorire lo shopping su mercati internazionali e in diverse lingue.

Livello 1. A questo livello, gli sviluppatori utilizzano strumenti come Cognitive Tool Kit e hardware ottimizzato per ML per costruire modelli nuovi e originali che rispondono a specifiche esigenze. Si tratta di qualcosa di facile da dire e difficile da fare, perché richiede esperti in machine learning, architetture e ottimizzazione di sistemi.

Come esempio di questo livello Lee ha citato il partner UPMC Enterprises, una divisione a fini di lucro del servizio non-profit di assistenza sanitaria dell’University of Pittsburgh Medical Center (UPMC). In questo momento non è possibile divulgare i dettagli del modello che sta costruendo UPMC, ma Lee ha spiegato che consentirà ai medici di migliorare le loro prestazioni e la cura offerta ai pazienti.

UPMC ha affidato all’esperto di ML Adam Berger il compito di formare il team di lavoro e guidare il progetto. Dopo che il modello sarà stato creato, istruito e testato, UPMC prevede di commercializzare la soluzione ad altre realtà che offrono servizi di assistenza sanitaria, un settore in cui Microsoft ha 168.000 clienti, tra produttività e IT, in 140 paesi. Pittsburgh può contare su una grande comunità medica, con importanti ospedali universitari e istituti di ricerca, e su una delle principali comunità AI e ML che ha il suo centro alla Carnegie Mellon University.

Livello 2. Il pokerbot Libratus sviluppato dalla Carnegie Mellon University, che sfida i campioni di poker, e il bot AlphaGo di Google, che ha battuto il campione mondiale Lee Sedol, rappresentano un caso particolare del livello 2, dove si trova un’intelligenza artificiale generale (AGI, artificial general intelligence). AGI è una ipotetica macchina intelligente, discussa da ricercatori e scrittori di fantascienza, che sarà in grado di svolgere qualsiasi compito intellettuale tipico di una mente umana. Libratus e AlphaGo rappresentano un’AGI che opera nel campo ristretto di un gioco, tuttavia si tratta di tecnologie uniche perché usano l’autoapprendimento e non sono limitate dall’esperienza umana.

La maggior parte dei modelli di machine learning sono istruiti per emulazione dell’intelligenza umana. Per esempio, il servizio di traduzione di Google è stato addestrato attraverso l’esame di circa un terzo dei contenuti pubblici presenti su Internet.

Se Libratus fosse stato un tipo di intelligenza “tradizionale”, avrebbe osservato miliardi di mani di poker e poi applicato l’osservazione per formare un modello basato sul comportamento umano. Invece, ha imparato le regole per vincere sperimentando ogni possibile giocata. AlphaGo è stato istruito in modo simile e ha stupito Sedol con uno stile di gioco creato in modo autonomo e non limitato dall’intelligenza umana.

Lee ha utilizzato Libratus e AlphaGo per illustrare a Nadella casi, pur molto specifici, in cui è stato possibile realizzare un’AGI.

La difficoltà di distribuire il machine learning

La supply chain per distribuire alle aziende i benefici del ML è ancora un problema. Lee spiega che i modelli di apprendimento automatico, come per esempio un servizio di traduzione, sono creati da gruppi “privilegiati” di esperti. Sono privilegiati nel senso che sono formati da persone competenti in machine learning, algebra lineare e probabilità, che spesso provengono dalle migliori università. Si tratta di poche persone altamente specializzate e concentrate in poche aziende, come Facebook, Google, IBM e Microsoft.

Come si può superare l’attuale carenza di competenze e distribuire l’AI alle aziende? I modelli avanzati di ML vengono sviluppati da ricercatori specializzati, per poi essere ottimizzati da esperti di ML e sistemi informatici in modo che possano essere eseguiti sull’hardware oggi disponibile. Nell’ultimo passaggio, sviluppatori riscrivono i componenti che consumano più risorse con codice nativo veloce e li ottimizzano per un impiego efficace delle risorse e il contenimento dei costi. Gli strumenti di sviluppo del ML sono complessi e i metodi ancora immaturi, secondo Lee, e questo impedisce agli sviluppatori meno esperti di costruire modelli.

La strategia di Microsoft per offrire i vantaggi dell’AI

Il livello 0 oggi funziona. Microsoft ha migliaia di clienti che utilizzano i suoi modelli pre-istruiti disponibili tramite cloud. Alle applicazioni esistenti è possibile aggiungere funzionalità di elaborazione del linguaggio naturale, analisi del testo e traduzione linguaggio attraverso le API Cognitive Services di Microsoft.

Il livello 1 è più difficile da raggiungere, perché l’ampliamento dei team di esperti non è una strada sempre percorribile e non ci sono ancora strumenti che consentono a qualsiasi sviluppatore di costruire modelli di ML. Lee ha spiegato che Microsoft farà leva sui due decenni di ricerche in AI per aiutare i partner a costruire modelli originali di ML per risolvere nuovi problemi.

Secondo Lee, a questo livello si possono muovere meglio i partner, a patto che abbiano al loro interno competenze ML. I partner possono creare un modello nuovo e originale per risolvere problemi specifici; una volta testato, il modello può essere distribuito e commercializzato, in modo simile alla soluzione che sta sviluppando l’UPMC per il settore sanitario.

Lee punta a investire in settori verticali, ed è disposto a portare il personale di partner selezionati nei laboratori di Microsoft per lavorare fianco a fianco con i ricercatori e creare nuovi modelli originali che potrebbero poi essere venduti a un intero settore verticale.

Anche se Lee ha una preferenza per lo strumento open source Cognitive Tool Kit di Microsoft, non ha preclusioni sull’uso di TensorFlow di Google o Caffe 2 di Facebook se rappresentano una scelta migliore. Questo perché, nell’era post-Ballmer, il successo si misura in base all’impatto sul business cloud di Microsoft.

I modelli del livello 2 rappresentano un punto di riferimento nelle ricerca di Microsoft per misurare i progressi verso il raggiungimento dell’obiettivo a lungo termine dell’AGI.