Proiectarea unei interfețe de utilizator VUI – Voice

Publicat: 2022-03-11

Din ce în ce mai multe dispozitive controlate prin voce, cum ar fi Apple HomePod, Google Home și Amazon Echo, năvălesc pe piață. Interfețele de utilizator vocale ajută la îmbunătățirea a tot felul de experiențe diferite ale utilizatorului, iar unii cred că vocea va alimenta 50% din toate căutările până în 2020.

Inteligența artificială activată prin voce poate avea grijă de aproape orice într-o clipă.

  • „Ce urmează în calendarul meu?”
  • „Rezervați-mi un taxi până la Oxford Street.”
  • „Cântă-mi niște jazz pe Spotify!”

Toate cele cinci companii tehnologice „Big Five” – Microsoft, Google, Amazon, Apple și Facebook – au dezvoltat (sau dezvoltă în prezent) asistenți AI cu voce. Siri, asistentul AI pentru dispozitivele Apple iOS și HomePod, ajută mai mult de 40 de milioane de utilizatori pe lună și, potrivit ComScore, una din 10 gospodării din SUA deține deja un difuzor inteligent astăzi.

Fie că vorbim despre VUI (Voice User Interfaces) pentru aplicații mobile sau pentru difuzoare inteligente de acasă, interacțiunile vocale devin din ce în ce mai frecvente în tehnologia actuală, mai ales că oboseala ecranului este o preocupare.

Amazon
Echo Spot este cel mai recent difuzor inteligent de la Amazon care combină un VUI cu o interfață grafică, comparabilă cu Echo Show.

Ce pot face utilizatorii cu comenzile vocale?

Alexa este asistentul AI pentru dispozitivele Amazon cu voce, cum ar fi difuzorul inteligent Echo și tableta Kindle Fire — Amazon este în prezent lider în tehnologia vocală (în ceea ce privește vânzările).

În magazinul Alexa, unele dintre cele mai la modă aplicații (numite „aptitudini”) sunt axate pe divertisment, traducere și știri, deși utilizatorii pot, de asemenea, să efectueze acțiuni precum solicitarea unei călătorii prin abilitate Uber, reda muzică prin abilitate Spotify sau chiar și comandă o pizza prin îndemânarea lui Domino.

Un alt exemplu interesant vine de la banca comercială Capital One, care a introdus o abilitate Alexa în 2016 și a fost prima bancă care a făcut acest lucru. Adăugând abilitățile Capital One prin Alexa, clienții își pot verifica soldul și datele scadente și chiar pot plăti factura cardului de credit. PayPal a dus conceptul cu un pas mai departe, permițând utilizatorilor să efectueze plăți prin Siri fie pe iOS, fie pe Apple HomePod și există, de asemenea, o abilitate Alexa pentru PayPal care poate realiza acest lucru.

Dar ceea ce pot face VUI-urile și pentru ce le folosesc de fapt utilizatorii sunt două lucruri diferite.

ComScore a declarat că peste jumătate dintre utilizatorii care dețin un difuzor inteligent își folosesc dispozitivul pentru a pune întrebări generale, a verifica vremea și a transmite muzică în flux, urmat îndeaproape de gestionarea alarmei, a listei de sarcini și a calendarului (rețineți că aceste sarcini sunt destul de de bază prin natura lor).

După cum puteți vedea, multe dintre aceste sarcini implică adresarea unei întrebări (de exemplu, căutarea vocală).

Statistici pentru utilizarea difuzoarelor inteligente în SUA
Utilizarea difuzoarelor inteligente în SUA conform ComScore.

Ce caută utilizatorii cu căutarea vocală?

Oamenii folosesc cel mai mult căutarea vocală atunci când conduc, deși orice situație în care utilizatorul nu poate atinge un ecran (de exemplu, când gătește sau face exerciții fizice sau când încearcă să facă mai multe sarcini la locul de muncă), oferă o oportunitate pentru interacțiuni vocale. Iată defalcarea completă după HigherVisibility.

Aplicația de voce Android Auto și interfața de utilizator vocală
Actualizările de trafic în timp real devin mult mai ușoare în timpul conducerii, datorită Asistentului Google și Android Auto.

Efectuarea cercetării utilizatorilor pentru interfețele vocale cu utilizatorul

Deși este util să știm cum folosesc utilizatorii în general vocea, este important ca designerii UX să-și efectueze propria cercetare asupra utilizatorilor, specifică aplicației VUI pe care o proiectează.

Maparea călătoriei clienților

Cercetarea utilizatorilor se referă la înțelegerea nevoilor, comportamentelor și motivațiilor utilizatorului prin observație și feedback. O hartă a călătoriei clienților care include vocea ca canal nu poate doar să-i ajute pe cercetătorii în experiența utilizatorului să identifice nevoile utilizatorilor în diferitele etape de implicare, dar îi poate ajuta și să vadă cum și unde vocea poate fi o metodă de interacțiune.

În scenariul în care o hartă a călătoriei clienților nu a fost încă creată, designerul ar trebui să evidențieze locul în care interacțiunile vocale ar avea în vedere fluxul utilizatorului (acest lucru ar putea fi evidențiat ca o oportunitate, un canal sau un punct de contact). Dacă o hartă a călătoriei clienților există deja pentru afacere, atunci designerii ar trebui să vadă dacă fluxul de utilizatori poate fi îmbunătățit prin interacțiuni vocale.

De exemplu, dacă clienții pun mereu o anumită întrebare prin intermediul rețelelor sociale sau prin chat de asistență live, atunci poate că aceasta este o conversație care poate fi integrată în aplicația vocală.

Pe scurt, designul ar trebui să rezolve problemele. Ce fricțiuni și frustrări întâmpină utilizatorii în timpul călătoriei clientului?

Analiza concurenței VUI

Prin analiza concurenților, designerii ar trebui să încerce să afle dacă și cum implementează concurenții interacțiunile vocale. Întrebările cheie de pus sunt:

  • Care este cazul de utilizare pentru aplicația lor?
  • Ce comenzi vocale folosesc?
  • Ce spun clienții în recenziile aplicației și ce putem învăța din asta?

Doriți designeri de interfață de utilizare independenți cu normă întreagă din SUA ### Colectarea cerințelor

Pentru a proiecta o aplicație de interfață vocală cu utilizatorul, trebuie mai întâi să definim cerințele utilizatorilor. Pe lângă crearea unei hărți a călătoriei clienților și efectuarea analizei concurenței (după cum s-a menționat mai sus), pot fi utile și alte activități de cercetare, cum ar fi interviurile și testarea utilizatorilor.

Pentru proiectarea VUI, aceste cerințe scrise sunt cu atât mai importante cu cât vor cuprinde majoritatea specificațiilor de proiectare pentru dezvoltatori. Primul pas este să capturați diferitele scenarii înainte de a le transforma într-un flux de dialog conversațional între utilizator și asistentul vocal.

Un exemplu de poveste de utilizator pentru aplicația de știri ar putea fi:

„În calitate de utilizator, vreau ca asistentul vocal să citească cele mai recente articole de știri, astfel încât să pot fi la curent cu ceea ce se întâmplă fără a fi nevoit să mă uit la ecran.”

Având în vedere această poveste de utilizator, apoi putem proiecta un flux de dialog pentru aceasta.

emiterea unei comenzi vocale pentru interfața utilizator controlată vocal

Anatomia unei comenzi vocale

Înainte de a putea fi creat un flux de dialog, designerii trebuie să înțeleagă mai întâi anatomia unei comenzi vocale. Atunci când proiectează VUI, designerii trebuie să se gândească în mod constant la obiectivul interacțiunilor vocale (adică, Ce încearcă utilizatorul să realizeze în acest scenariu? ).

Comanda vocală a unui utilizator constă din trei factori cheie: intenția , rostirea și spațiul .

Să analizăm următoarea solicitare: „Redați niște muzică relaxantă pe Spotify”.

Intenția (obiectivul interacțiunii vocale)

Intenția reprezintă obiectivul mai larg al comenzii vocale a utilizatorilor și aceasta poate fi fie o interacțiune cu utilitate redusă, fie o interacțiune cu utilitate ridicată .

O interacțiune cu utilitate ridicată se referă la îndeplinirea unei sarcini foarte specifice, cum ar fi solicitarea ca luminile din camera de zi să fie stinse sau ca dușul să aibă o anumită temperatură. Proiectarea acestor solicitări este simplă, deoarece este foarte clar ce se așteaptă de la asistentul AI.

Solicitările de utilitate scăzute sunt mai vagi și mai greu de descifrat. De exemplu, dacă utilizatorul ar dori să afle mai multe despre Amsterdam, am dori mai întâi să verificăm dacă acest lucru se încadrează sau nu în domeniul de aplicare al serviciului și apoi să îi punem utilizatorului mai multe întrebări pentru a înțelege mai bine cererea.

În exemplul dat, intenția este evidentă: utilizatorul dorește să audă muzică.

Exprimare (Cum exprimă utilizatorul o comandă)

Un enunț reflectă modul în care utilizatorul își exprimă cererea. În exemplul dat, știm că utilizatorul dorește să redea muzică pe Spotify spunând „Play me…”, dar aceasta nu este singura modalitate prin care un utilizator poate face această solicitare. De exemplu, utilizatorul ar putea spune, de asemenea, „Vreau să aud muzică...”.

Designerii trebuie să ia în considerare fiecare variație de enunț. Acest lucru va ajuta motorul AI să recunoască cererea și să o conecteze la acțiunea sau răspunsul potrivit.

Sloturi (variabilele obligatorii sau opționale)

Uneori, o singură intenție nu este suficientă și sunt necesare mai multe informații de la utilizator pentru a îndeplini cererea. Alexa îl numește „slot”, iar sloturile sunt ca câmpurile de formular tradiționale, în sensul că pot fi opționale sau obligatorii, în funcție de ceea ce este necesar pentru a finaliza solicitarea.

În cazul nostru, slotul este „relaxant”, dar, deoarece cererea poate fi încă finalizată fără el, acest slot este opțional. Totuși, în cazul în care utilizatorul dorește să rezerve un taxi, slotul ar fi destinația și ar fi obligatoriu. Intrările opționale suprascriu orice valori implicite; de exemplu, un utilizator care solicită unui taxi să sosească la ora 16:00 ar suprascrie valoarea implicită „cât mai curând posibil”.

Crearea de prototipuri a conversațiilor VUI cu fluxuri de dialog

Designerii de prototipuri trebuie să gândească ca un scenarist și fluxuri de dialog de proiectare pentru fiecare dintre aceste cerințe. Un flux de dialog este un livrabil care subliniază următoarele:

  • Cuvinte cheie care conduc la interacțiune
  • Ramuri care reprezintă unde ar putea duce conversația
  • Exemple de dialoguri atât pentru utilizator, cât și pentru asistent

Un flux de dialog este un script care ilustrează conversația dus-întors dintre utilizator și asistentul vocal. Un flux de dialog este ca un prototip și poate fi reprezentat ca o ilustrație (ca în exemplul de mai jos) sau există aplicații de prototipare care pot fi folosite pentru a crea fluxuri de dialog.

O ilustrare a unui flux de dialog pentru proiectarea VUI
Un exemplu de flux de dialog care ilustrează intenția, intervalul și conversația generală.

Aplicații pentru prototiparea VUI

Odată ce ați mapat fluxurile de dialog, sunteți gata să prototipați interacțiunile vocale folosind o aplicație. Câteva instrumente de prototipare au intrat deja pe piață; de exemplu, Sayspring facilitează crearea unui prototip funcțional pentru aplicațiile Amazon și Google cu voce.

Crearea de prototipuri a aplicațiilor VUI cu Sayspring
Sayspring este un instrument care facilitează prototiparea unei abilități Alexa sau Google Home Action.

Amazon oferă, de asemenea, propriul Alexa Skill Builder, care facilitează crearea de noi abilități Alexa pentru designeri. Google oferă un SDK; cu toate acestea, aceasta se adresează dezvoltatorilor Google Action . Apple nu și-a lansat încă instrumentul concurent, dar în curând vor lansa SiriKit.

Amazon
Alexa Skill Builder de la Amazon, unde designerii pot crea prototipuri de VUI pentru dispozitivele compatibile cu Alexa.

UX Analytics pentru aplicații de voce

După ce ați lansat o „aptitudine” pentru Alexa (sau o „acțiune” pentru Google), puteți urmări modul în care aplicația este utilizată cu analize. Ambele companii oferă un instrument de analiză încorporat; cu toate acestea, puteți integra și un serviciu terță parte pentru analize mai elaborate (cum ar fi voicelabs.co pentru Amazon Alexa sau dashbot.io pentru Google Assistant). Unele dintre valorile cheie la care trebuie să fii atent sunt:

  • Valori de implicare, cum ar fi sesiuni per utilizator sau mesaje per sesiune
  • Limbi folosite
  • Comportamentul curge
  • Mesaje, intenții și enunțuri

Alexa
Tabloul de bord Alexa Metrics de la Amazon arată valori precum sesiuni, enunțuri și intenții.

Sfaturi practice pentru proiectarea VUI

Păstrați comunicarea simplă și conversațională

Când proiectează aplicații mobile și site-uri web, designerii trebuie să se gândească la ce informații sunt primare și ce informații sunt secundare (adică, nu la fel de importante). Utilizatorii nu vor să se simtă supraîncărcați, dar, în același timp, au nevoie de suficiente informații pentru a-și îndeplini sarcina.

Cu vocea, designerii trebuie să fie și mai atenți, deoarece cuvintele (și poate o interfață grafică relativ simplă) sunt tot ceea ce există pentru a comunica. Acest lucru îl face deosebit de dificil în cazul transmiterii de informații și date complexe. Aceasta înseamnă că mai puține cuvinte sunt mai bune, iar designerii trebuie să se asigure că aplicația îndeplinește obiectivul utilizatorilor și rămâne strict conversațional.

Confirmați când o sarcină a fost finalizată

Când proiectați un flux de plată pentru comerțul electronic, unul dintre ecranele cheie va fi confirmarea finală. Acest lucru îi permite clientului să știe că tranzacția a fost înregistrată cu succes.

Același concept se aplică și designului VUI. De exemplu, dacă un utilizator se afla în sufragerie și-și cere asistentului vocal să stingă luminile din baie, fără o confirmare, ar trebui să intre în sufragerie și să verifice, învingând obiectul unui „hands-off”. ” Aplicația VUI în întregime.

În acest scenariu, un răspuns „lumini de baie stinse” se va descurca bine.

Creați o strategie puternică de eroare

În calitate de designer VUI, este important să aveți o strategie puternică de eroare. Proiectați întotdeauna pentru scenariul în care asistentul nu înțelege sau nu aude absolut nimic. Analytics poate fi folosit și pentru a identifica virajele greșite și interpretările greșite, astfel încât strategia de eroare să poată fi îmbunătățită.

Câteva dintre întrebările cheie pe care trebuie să le puneți atunci când căutați dialoguri alternative:

  • Ați identificat obiectivul interacțiunii?
  • Poate AI să interpreteze informațiile rostite de utilizator?
  • AI necesită mai multe informații de la utilizator pentru a îndeplini cererea?
  • Putem livra ceea ce a cerut utilizatorul?

Adăugați un strat suplimentar de securitate

Asistentul Google, Siri și Alexa pot recunoaște acum vocile individuale. Acest lucru adaugă un strat de securitate similar cu Face ID sau Touch ID. Software-ul de recunoaștere a vocii se îmbunătățește constant și devine din ce în ce mai greu să imiteți vocea; cu toate acestea, în acest moment, este posibil să nu fie suficient de sigur și poate fi necesară o autentificare suplimentară. Atunci când lucrează cu date sensibile, designerii ar putea avea nevoie să includă un pas suplimentar de autentificare, cum ar fi amprenta digitală, parola sau recunoașterea feței. Acest lucru este valabil mai ales în cazul mesajelor personale și al plăților.

Asistent vocal Duer cu software de recunoaștere a feței
Asistentul vocal Duer de la Baidu este folosit în mai multe restaurante KFC și folosește recunoașterea feței pentru a face sugestii de masă pe baza vârstei sau a comenzilor anterioare.

Zorii revoluției VUI

VUI-urile sunt aici pentru a rămâne și vor fi integrate în tot mai multe produse în următorii ani. Unii prevăd că nu vom folosi tastaturile în 10 ani pentru a interacționa cu computerele.

Totuși, când ne gândim la „experiența utilizatorului”, avem tendința de a ne gândi la ceea ce putem vedea și atinge. În consecință, vocea ca metodă de interacțiune este rareori luată în considerare. Cu toate acestea, vocea și elementele vizuale nu se exclud reciproc atunci când proiectați experiențe de utilizator – ambele adaugă valoare.

Cercetarea utilizatorilor trebuie să răspundă la întrebarea dacă vocea va îmbunătăți sau nu UX și, având în vedere cât de repede crește cota de piață pentru dispozitivele cu voce, această cercetare ar putea merita timpul și ar putea crește semnificativ valoarea și calitatea unui aplicația.

• • •

Citiri suplimentare pe Blogul Toptal Design:

  • eCommerce UX – O privire de ansamblu asupra celor mai bune practici (cu infografic)
  • Importanța designului centrat pe om în proiectarea produsului
  • Cele mai bune portofolii de designeri UX – Studii de caz și exemple inspiratoare
  • Principii euristice pentru interfețele mobile
  • Design anticipator: Cum să creați experiențe magice pentru utilizator