Progettazione di una VUI – Interfaccia utente vocale

Pubblicato: 2022-03-11

Sempre più dispositivi a controllo vocale, come Apple HomePod, Google Home e Amazon Echo, stanno prendendo d'assalto il mercato. Le interfacce utente vocali stanno contribuendo a migliorare tutti i tipi di esperienze utente diverse e alcuni ritengono che la voce alimenterà il 50% di tutte le ricerche entro il 2020.

L'IA abilitata alla voce può occuparsi di quasi tutto in un istante.

  • "Qual è il prossimo passo nel mio calendario?"
  • “Prenotami un taxi per Oxford Street.”
  • "Fammi ascoltare un po' di jazz su Spotify!"

Tutte e cinque le "Big Five" società tecnologiche - Microsoft, Google, Amazon, Apple e Facebook - hanno sviluppato (o stanno attualmente sviluppando) assistenti di intelligenza artificiale abilitati alla voce. Siri, l'assistente AI per dispositivi Apple iOS e HomePod, aiuta oltre 40 milioni di utenti al mese e, secondo ComScore, una famiglia su 10 negli Stati Uniti possiede già oggi un altoparlante intelligente.

Sia che si parli di VUI (Voice User Interfaces) per app mobili o per altoparlanti domestici intelligenti, le interazioni vocali stanno diventando più comuni nella tecnologia odierna, soprattutto perché l'affaticamento dello schermo è un problema.

Amazon
Echo Spot è l'ultimo altoparlante intelligente di Amazon che combina una VUI con una GUI, paragonabile a Echo Show.

Cosa possono fare gli utenti con i comandi vocali?

Alexa è l'assistente AI per i dispositivi Amazon abilitati alla voce come l'altoparlante intelligente Echo e il tablet Kindle Fire: Amazon è attualmente all'avanguardia con la tecnologia vocale (in termini di vendite).

Sull'Alexa Store, alcune delle app più trendy (chiamate "competenze") sono incentrate sull'intrattenimento, la traduzione e le notizie, sebbene gli utenti possano anche eseguire azioni come richiedere un passaggio tramite l'abilità Uber, riprodurre un po' di musica tramite l'abilità Spotify o anche ordinare una pizza tramite l'abilità di Domino.

Un altro esempio interessante viene dalla banca commerciale Capital One, che ha introdotto un'abilità Alexa nel 2016 ed è stata la prima banca a farlo. Aggiungendo l'abilità Capital One tramite Alexa, i clienti possono controllare il proprio saldo e le date di scadenza e persino saldare il conto della carta di credito. PayPal ha fatto un ulteriore passo avanti nel concetto consentendo agli utenti di effettuare pagamenti tramite Siri su iOS o Apple HomePod, e c'è anche un'abilità Alexa per PayPal che può raggiungere questo obiettivo.

Ma ciò che possono fare le VUI e per cosa gli utenti le stanno effettivamente utilizzando sono due cose diverse.

ComScore ha affermato che oltre la metà degli utenti che possiedono un altoparlante intelligente utilizza il proprio dispositivo per porre domande generali, controllare il meteo e ascoltare musica in streaming, seguiti da vicino dalla gestione della sveglia, dell'elenco delle cose da fare e del calendario (si noti che queste attività sono abbastanza fondamentale per natura).

Come puoi vedere, molte di queste attività implicano porre una domanda (ad esempio, la ricerca vocale).

Statistiche sull'utilizzo degli altoparlanti intelligenti negli Stati Uniti
Utilizzo degli altoparlanti intelligenti negli Stati Uniti secondo ComScore.

Cosa cercano gli utenti con la ricerca vocale?

Le persone utilizzano principalmente la ricerca vocale durante la guida, sebbene qualsiasi situazione in cui l'utente non sia in grado di toccare uno schermo (ad esempio, quando si cucina o si fa esercizio fisico, o quando si cerca di svolgere più attività al lavoro), offre l'opportunità di interazioni vocali. Ecco la ripartizione completa per HigherVisibility.

App vocale Android Auto e interfaccia utente vocale
Gli aggiornamenti sul traffico in tempo reale stanno diventando molto più semplici durante la guida grazie all'Assistente Google e ad Android Auto.

Condurre ricerche utente per interfacce utente vocali

Sebbene sia utile sapere in che modo gli utenti utilizzano generalmente la voce, è importante che i designer di UX conducano la propria ricerca sugli utenti specifica per l'app VUI che stanno progettando.

Mappatura del percorso del cliente

La ricerca degli utenti riguarda la comprensione dei bisogni, dei comportamenti e delle motivazioni dell'utente attraverso l'osservazione e il feedback. Una mappa del percorso del cliente che includa la voce come canale non solo può aiutare i ricercatori dell'esperienza utente a identificare le esigenze degli utenti nelle varie fasi del coinvolgimento, ma può anche aiutarli a vedere come e dove la voce può essere un metodo di interazione.

Nello scenario in cui una mappa del percorso del cliente deve ancora essere creata, il progettista dovrebbe evidenziare dove le interazioni vocali influirebbero nel flusso dell'utente (questo potrebbe essere evidenziato come un'opportunità, un canale o un punto di contatto). Se esiste già una mappa del percorso del cliente per l'azienda, i progettisti dovrebbero vedere se il flusso utente può essere migliorato con le interazioni vocali.

Ad esempio, se i clienti fanno sempre una determinata domanda tramite i social media o la chat di supporto dal vivo, forse è una conversazione che può essere integrata nell'app vocale.

In breve, il design dovrebbe risolvere i problemi. Quali attriti e frustrazioni incontrano gli utenti durante il percorso del cliente?

Analisi della concorrenza VUI

Attraverso l'analisi della concorrenza, i progettisti dovrebbero cercare di scoprire se e come i concorrenti stanno implementando le interazioni vocali. Le domande chiave da porsi sono:

  • Qual è il caso d'uso della loro app?
  • Quali comandi vocali usano?
  • Cosa dicono i clienti nelle recensioni dell'app e cosa possiamo imparare da questo?

Volevano designer di interfaccia utente freelance a tempo pieno con sede negli Stati Uniti ### Raccolta dei requisiti

Per progettare un'app per l'interfaccia utente vocale, dobbiamo prima definire i requisiti degli utenti. Oltre a creare una mappa del percorso del cliente e condurre analisi della concorrenza (come menzionato sopra), possono essere utili anche altre attività di ricerca come interviste e test degli utenti.

Per la progettazione di VUI, questi requisiti scritti sono tanto più importanti poiché comprenderanno la maggior parte delle specifiche di progettazione per gli sviluppatori. Il primo passo è catturare i diversi scenari prima di trasformarli in un flusso di dialogo colloquiale tra l'utente e l'assistente vocale.

Un esempio di user story per l'applicazione di notizie potrebbe essere:

"Come utente, voglio che l'assistente vocale legga gli ultimi articoli di notizie in modo da poter essere aggiornato su ciò che sta accadendo senza dover guardare il mio schermo".

Tenendo presente questa user story, possiamo quindi progettare un flusso di dialogo per essa.

emissione di un comando vocale per l'interfaccia utente a comando vocale

L'anatomia di un comando vocale

Prima di poter creare un flusso di dialogo, i progettisti devono prima comprendere l'anatomia di un comando vocale. Durante la progettazione di VUI, i progettisti devono costantemente pensare all'obiettivo delle interazioni vocali (ad esempio, cosa sta cercando di ottenere l'utente in questo scenario? ).

Il comando vocale di un utente è costituito da tre fattori chiave: l' intento , l' espressione e lo slot .

Analizziamo la seguente richiesta: "Riproduci della musica rilassante su Spotify".

Intento (l'obiettivo dell'interazione vocale)

L'intento rappresenta l'obiettivo più ampio del comando vocale di un utente e può essere un'interazione di bassa utilità o di alta utilità .

Un'interazione di alta utilità riguarda l'esecuzione di un compito molto specifico, come richiedere che le luci nel soggiorno vengano spente o che la doccia abbia una certa temperatura. Progettare queste richieste è semplice poiché è molto chiaro cosa ci si aspetta dall'assistente AI.

Le richieste di bassa utilità sono più vaghe e più difficili da decifrare. Ad esempio, se l'utente desidera saperne di più su Amsterdam, vorremmo prima verificare se questo rientra o meno nell'ambito del servizio e quindi porre all'utente più domande per comprendere meglio la richiesta.

Nell'esempio fornito, l'intento è evidente: l'utente desidera ascoltare la musica.

Enunciato (come l'utente formula un comando)

Un'espressione riflette il modo in cui l'utente formula la propria richiesta. Nell'esempio fornito, sappiamo che l'utente desidera riprodurre musica su Spotify dicendo "Riproducimi...", ma questo non è l'unico modo in cui un utente può effettuare questa richiesta. Ad esempio, l'utente potrebbe anche dire: "Voglio ascoltare musica...".

I progettisti devono considerare ogni variazione di espressione. Ciò aiuterà il motore di intelligenza artificiale a riconoscere la richiesta e a collegarla all'azione o alla risposta corretta.

Slot (le variabili obbligatorie o facoltative)

A volte un intento da solo non è sufficiente e sono necessarie maggiori informazioni all'utente per soddisfare la richiesta. Alexa lo chiama "slot" e gli slot sono come i campi modulo tradizionali, nel senso che possono essere facoltativi o obbligatori, a seconda di ciò che è necessario per completare la richiesta.

Nel nostro caso, lo slot è "rilassante", ma poiché la richiesta può ancora essere completata senza di esso, questo slot è facoltativo. Tuttavia, nel caso in cui l'utente volesse prenotare un taxi, lo slot sarebbe la destinazione e sarebbe obbligatorio. Gli input opzionali sovrascrivono qualsiasi valore predefinito; ad esempio, un utente che richiede un taxi per arrivare alle 16:00 sovrascriverebbe il valore predefinito di "il prima possibile".

Prototipazione di conversazioni VUI con flussi di dialogo

I progettisti di prototipi devono pensare come uno sceneggiatore e progettare flussi di dialogo per ciascuno di questi requisiti. Un flusso di dialogo è un deliverable che delinea quanto segue:

  • Parole chiave che portano all'interazione
  • Rami che rappresentano dove potrebbe portare la conversazione
  • Esempi di finestre di dialogo sia per l'utente che per l'assistente

Un flusso di dialogo è uno script che illustra la conversazione avanti e indietro tra l'utente e l'assistente vocale. Un flusso di dialogo è come un prototipo e può essere rappresentato come un'illustrazione (come nell'esempio seguente) oppure esistono app di prototipazione che possono essere utilizzate per creare flussi di dialogo.

Un'illustrazione di un flusso di dialogo per la progettazione di VUI
Un flusso di dialogo di esempio che illustra l'intento, lo slot e la conversazione generale.

App per la creazione di prototipi di VUI

Dopo aver mappato i flussi di dialogo, sei pronto per prototipare le interazioni vocali utilizzando un'app. Alcuni strumenti di prototipazione sono già entrati nel mercato; ad esempio, Sayspring consente ai designer di creare facilmente un prototipo funzionante per le app Amazon e Google abilitate alla voce.

Prototipazione di app VUI con Sayspring
Sayspring è uno strumento che semplifica la creazione di prototipi di Alexa Skill o Google Home Action.

Amazon offre anche il proprio Alexa Skill Builder, che consente ai designer di creare facilmente nuove abilità Alexa. Google offre un SDK; tuttavia, questo è rivolto agli sviluppatori di Google Action . Apple non ha ancora lanciato il suo strumento concorrente, ma presto lancerà SiriKit.

Amazon
Alexa Skill Builder di Amazon, in cui i progettisti possono prototipare VUI per dispositivi abilitati per Alexa.

Analisi UX per app vocali

Dopo aver implementato una "abilità" per Alexa (o un'"azione" per Google), puoi tenere traccia di come l'app viene utilizzata con l'analisi. Entrambe le società offrono uno strumento di analisi integrato; tuttavia, puoi anche integrare un servizio di terze parti per analisi più elaborate (come voicelabs.co per Amazon Alexa o dashbot.io per Google Assistant). Alcune delle metriche chiave da tenere d'occhio sono:

  • Metriche di coinvolgimento, come sessioni per utente o messaggi per sessione
  • Lingue usate
  • Il comportamento scorre
  • Messaggi, intenti ed espressioni

Alessia
Il dashboard di Alexa Metrics di Amazon mostra parametri come sessioni, espressioni e intenti.

Suggerimenti pratici per la progettazione VUI

Mantieni la comunicazione semplice e colloquiale

Quando progettano app e siti Web mobili, i progettisti devono pensare a quali informazioni sono primarie e quali sono secondarie (cioè non così importanti). Gli utenti non vogliono sentirsi sovraccaricati, ma allo stesso tempo hanno bisogno di informazioni sufficienti per completare il loro compito.

Con la voce, i progettisti devono essere ancora più attenti perché le parole (e forse una GUI relativamente semplice) sono tutto ciò con cui comunicare. Ciò rende particolarmente difficile la trasmissione di informazioni e dati complessi. Ciò significa che meno parole sono migliori e i progettisti devono assicurarsi che l'app soddisfi l'obiettivo degli utenti e rimanga strettamente colloquiale.

Conferma quando un'attività è stata completata

Quando si progetta un flusso di pagamento eCommerce, una delle schermate chiave sarà la conferma finale. Ciò consente al cliente di sapere che la transazione è stata registrata con successo.

Lo stesso concetto si applica al design VUI. Ad esempio, se un utente fosse in salotto e chiedesse al proprio assistente vocale di spegnere le luci del bagno, senza una conferma, dovrebbe entrare in salotto e controllare, vanificando l'oggetto di un "senza mani ” App VUI interamente.

In questo scenario, una risposta "Luci del bagno spente" andrà bene.

Crea una strategia di errore forte

In qualità di designer di VUI, è importante disporre di una forte strategia di errore. Progetta sempre per lo scenario in cui l'assistente non capisce o non sente nulla. L'analisi può essere utilizzata anche per identificare le svolte sbagliate e le interpretazioni errate in modo da poter migliorare la strategia di errore.

Alcune delle domande chiave da porre durante la ricerca di finestre di dialogo alternative:

  • Hai individuato l'obiettivo dell'interazione?
  • L'IA può interpretare le informazioni pronunciate dall'utente?
  • L'IA richiede maggiori informazioni dall'utente per soddisfare la richiesta?
  • Siamo in grado di fornire ciò che l'utente ha richiesto?

Aggiungi un ulteriore livello di sicurezza

Google Assistant, Siri e Alexa ora possono riconoscere le singole voci. Ciò aggiunge un livello di sicurezza simile a Face ID o Touch ID. Il software di riconoscimento vocale è in costante miglioramento e sta diventando sempre più difficile imitare la voce; tuttavia, in questo momento, potrebbe non essere sufficientemente sicuro e potrebbe essere necessaria un'autenticazione aggiuntiva. Quando si lavora con dati sensibili, i progettisti potrebbero dover includere un passaggio di autenticazione aggiuntivo come impronte digitali, password o riconoscimento facciale. Ciò è particolarmente vero nel caso di messaggi e pagamenti personali.

Due assistente vocale con software di riconoscimento facciale
L'assistente vocale Duer di Baidu è utilizzato in diversi ristoranti KFC e utilizza il riconoscimento facciale per dare suggerimenti sui pasti in base all'età o agli ordini precedenti.

L'alba della rivoluzione VUI

Le VUI sono qui per restare e saranno integrate in un numero sempre maggiore di prodotti nei prossimi anni. Alcuni prevedono che non useremo le tastiere tra 10 anni per interagire con i computer.

Tuttavia, quando pensiamo all'"esperienza dell'utente", tendiamo a pensare a ciò che possiamo vedere e toccare. Di conseguenza, la voce come metodo di interazione è raramente considerata. Tuttavia, la voce e le immagini non si escludono a vicenda durante la progettazione delle esperienze utente: entrambe aggiungono valore.

La ricerca degli utenti deve rispondere alla domanda se la voce migliorerà o meno l'UX e, considerando la velocità con cui sta aumentando la quota di mercato dei dispositivi abilitati alla voce, fare questa ricerca potrebbe valere la pena e aumentare significativamente il valore e la qualità di un app.

• • •

Ulteriori letture sul blog di Toptal Design:

  • eCommerce UX: una panoramica delle migliori pratiche (con infografica)
  • L'importanza del design incentrato sull'uomo nel design del prodotto
  • I migliori portfolio di designer UX: casi di studio ed esempi stimolanti
  • Principi euristici per interfacce mobili
  • Design anticipatorio: come creare esperienze utente magiche