Le tecnologie di riconoscimento vocale sono migliorate così tanto negli ultimi anni grazie al cloud computing e ai progressi nell’apprendimento automatico, che gli assistenti virtuali creati da Amazon, Google e Apple sono diventati rapidamente sempre più popolari tra i consumatori. Quindi non dovrebbe sorprendere che questa tecnologia derivante dalla comprensione del linguaggio naturale si stia facendo largo anche sul posto di lavoro.

“L’adozione da parte delle aziende è ancora nelle fasi iniziali, ma oggi ci sono già delle funzionalità di base che possono tornare utili in un’ambiente enterprise” ha dichiarato Jon Arnold di J Arnold & Associates alla conferenza Enterprise Connect. Gli usi principali del riconoscimento vocale in ufficio, almeno all’inizio, ruotano attorno al miglioramento della produttività dei dipendenti e all’automazione dei flussi di lavoro.

Grazie ai progressi delle tecniche di intelligenza artificiale, l’accuratezza dei sistemi di riconoscimento vocale è migliorata in modo significativo, con Google e altri che hanno superato il punteggio di accuratezza del 95%. “Questa tecnologia è migliorata notevolmente negli ultimi anni, ma ciò che davvero conta è che ha superato la soglia per cui è alla pari con il riconoscimento vocale umano”, ha dichiarato Arnold.

Per le aziende ci sono quattro modi principali per accedere alle tecnologie vocali.

Lo speech-to-text può essere utilizzato per scopi come la dettatura di e-mail e diventa più preciso man mano che viene utilizzato.

La sintesi vocale offre vantaggi nelle impostazioni mobile, come la possibilità di creare podcast personali per rivedere documenti di lavoro o note durante un tragitto giornaliero.

Il riconoscimento vocale consente anche interazioni tramite assistenti virtuali, impartendo comandi come la ricerca di documenti o la creazione di voci del calendario.

L’analisi del parlato può consentire analisi del sentimento nell’azienda, che possono essere utili in situazioni di colloquio o di formazione.

Arnold ha indicato quattro pietre miliari che hanno aiutato a diffondere le tecnologie vocali e le hanno portate avanti. Il primo è stato il lancio, dieci anni fa, di Google Voice Search, che utilizzava il riconoscimento vocale per accelerare le ricerche sui dispositivi mobile. In seguito, nel 2011, Apple ha lanciato Siri, che ha consentito maggiori interazioni di conversazione e una tecnologia vocale avanzata.

Lo stesso anno IBM Watson ha ottenuto un’enorme attenzione dopo la sua comparsa in TV nello show Jeopardy!, mentre nel 2015 Amazon ha lanciato Echo e il suo assistente virtuale Alexa, ottenendo (anche se per ora quasi solo negli USA) un ottimo riscontro da parte dell’utenza consumer. Più recentemente Amazon ha messo gli occhi sull’ambiente di lavoro (e non più solo su quello domestico) con la presentazione di Alexa for Business. Amazon non è però l’unica azienda a offrire gli assistenti virtuali come soluzione aziendale, visto che anche Cisco Spark Assistant, Cortana, Eva, Nuance Dragon e IBM Watson Assistant stanno trovando posto negli uffici.

Durante un keynote all’Enterprise Connect Dave Isbitski, capo evangelista di Amazon per Echo e Alexa, ha affermato che le interfacce vocali saranno la prossima grande disruption nelll’informatica. “È questa idea di ambient computing, ovvero l’idea che in qualsiasi momento potrei semplicemente dire Alexa fai partire la mia chat di gruppo, Alexa come sono i miei dati di vendita? o Alexa ho dimenticato di spegnere il proiettore nella sala conferenze: per favore spegnilo per me”.

“È molto naturale e spontaneo e tutto questo sta accadendo grazie ai progressi in quello che è chiamato NLU (comprensione del linguaggio naturale). Ed è questa è la vera differenza: la comprensione del contesto.” Secondo Collin Davis, direttore generale di Alexa for Business, gli assistenti virtuali stanno già aiutando i dipendenti nel loro lavoro di tutti i giorni.

“Quello che stiamo scoprendo è che sta avvenendo un cambiamento davvero interessante, dove la voce sta offrendo quasi un’altra dimensione di multi-tasking e dove i lavoratori seduti alla scrivania possono usare Alexa quasi come un multi-tasker vocale per poter ottenere rapidamente le informazioni senza perdere attenzione”, ha detto Davis. “Se state lavorando su un rapporto e dovete sapere quante offerte sono state chiuse l’ultimo trimestre, potete farlo senza trovare un’app o cambiare sito web, ma chiedendo ad Alexa o a un altro assistente virtuale quello che vi serve”.

Al momento Alexa è in grado di rispondere a oltre 30.000 tipi di domande e una comunità in crescita di sviluppatori è focalizzata sulla costruzione di competenze per l’ambiente di lavoro, mentre molti produttori di software stanno aggiungendo le funzioni vocali alle loro applicazioni esistenti. Le aziende che esaminano i sistemi di riconoscimento vocale hanno diverse aspetti da considerare prima di procedere con il loro utilizzo. Il primo è capire con quale azienda collaborare. I principali cloud provider (Amazon, Google, Microsoft e IBM) offrono tutti tecnologie vocali, ma ognuno ha i suoi punti di forza e di debolezza.

Identificare un forte business case per gli investimenti è fondamentale ed è per questo che le aziende devono porsi alcune domande precise. “Che equilibrio voglio raggiungere? Chi deve farsi carico di questa decisione? Quali problematiche sto cercando di affrontare? Sto facendo solo un aggiornamento tecnologico o sto davvero pensando alla trasformazione digitale e a quello che porta con sé l’intelligenza artificiale?”, continua Arnold.

Anche con i recenti progressi tecnologici la tecnologia non è perfetta, ma il riconoscimento vocale non ha bisogno di arrivare al 100% di accuratezza e già ora è decisamente avanzato. “Non credo che si debba aspettare ancora un paio di anni prima che diventi veramente valido. Non è al 100% e non lo sarà mai, ma non è nemmeno necessario che lo sia. Quindi non puntate alla perfezione ma a comprendere la tecnologia e cosa essa può fare per la vostra azienda”.