C’è una funzionalità di Google Home abbastanza curiosa, scoperta per caso.
“Ok, Google. Racconta una favola.”
C’era una volta una frase molto molto lunga senza punteggiatura che continuava ad allungarsi ed ad allungarsi fino a che non ti è venuto sonno e ti sei addormentata. Fine.
Sulla scia, gli ho chiesto di cantare una canzone e di raccontare una barzelletta. Vabbè, non è più finita.
Torniamo alla storia. Avete notato una cosa?
Rileggete attentamente. L’indizio è che sono stata io dargli il comando.
Trovato? Bè, alla fine della frase ha detto “e ti sei addormentata“: ha riconosciuto la voce femminile. Con un semplice passato prossimo al fermminile, ha creato un’interazione “coinvolgente”.
Linguaggio naturale e voice assistant
La favola di Google è un interessante esempio di linguaggio naturale, che è un po’ quello che ci mette in crisi quando parliamo con un assistente vocale. Il sottile disagio che proviamo (almeno, io lo provo) quando tentiamo di dialogare con uno smart assistant deriva dallo scollamento tra l’immediatezza dell’interazione vocale (è più semplice per noi parlare anziché digitare qualcosa su una tastiera o uno schermo) e il tipo di feedback che riceviamo.
Mentre siamo più o meno tutti abituati ormai a ricevere feedback “visivi” su schermo – se scrivo una parola su Google, mi aspetto che mi compaiano i risultati della ricerca -, lo stesso non si può dire nell’utilizzo delle voice user interfaces, come nel caso degli assistenti vocali.
Il gap deriva da un processo cognitivo che dovremmo applicare a questo tipo di tecnologia e che non abbiamo ancora elaborato: il suono della voce è naturale, ma la conversazione che viene portata avanti non lo è (ancora).
I bias cognitivi che mettiamo in atto sono quelli che, dato il contesto, si legano alla sfera della conversazione tra umani: quindi, se io parlo, mi aspetto che l’interlocutore mi risponda in un determinato modo.
Ma lo schema di interazione dell’interlocutore ripropone quello dell’interazione uomo – computer, mediato da schermo. Quindi a una domanda espressa a voce, io mi attendo una risposta naturale, quasi a livello di conversazione, mentre il voice assistant mi risponde “leggendo” una serie di informazioni, anche se con una voce simile a quella umana e magari con una punta di ironia, come nel caso di Google (Alexa no, non ha il senso dell’humor).
In sostanza, al di là delle funzionalità che gli smart assistant svilupperanno, la vera sfida sta nella capacità dell’uomo di adattarsi a un tipo di interazione nuova, concependo nuovi modelli mentali. L’organizzazione e – soprattutto – la modalità di presentazione delle informazioni nelle voice user interfaces faranno in questo nuovo contesto davvero la differenza.