Merancang VUI – Antarmuka Pengguna Suara

Diterbitkan: 2022-03-11

Semakin banyak perangkat yang dikendalikan suara, seperti Apple HomePod, Google Home, dan Amazon Echo, menyerbu pasar. Antarmuka pengguna suara membantu meningkatkan semua jenis pengalaman pengguna yang berbeda, dan beberapa percaya bahwa suara akan mendukung 50% dari semua pencarian pada tahun 2020.

AI yang diaktifkan dengan suara dapat menangani hampir semua hal dalam sekejap.

  • “Apa yang ada di Kalender saya selanjutnya?”
  • “Pesankan aku taksi ke Oxford Street.”
  • “Mainkan saya Jazz di Spotify!”

Kelima perusahaan teknologi “Lima Besar”—Microsoft, Google, Amazon, Apple, dan Facebook—telah mengembangkan (atau sedang mengembangkan) asisten AI yang diaktifkan dengan suara. Siri, asisten AI untuk perangkat Apple iOS dan HomePod, membantu lebih dari 40 juta pengguna per bulan, dan menurut ComScore, satu dari 10 rumah tangga di AS sudah memiliki speaker pintar hari ini.

Baik kita berbicara tentang VUI (Voice User Interfaces) untuk aplikasi seluler atau untuk speaker rumah pintar, interaksi suara menjadi lebih umum dalam teknologi saat ini, terutama karena kelelahan layar menjadi perhatian.

Amazon
Echo Spot adalah speaker pintar terbaru Amazon yang menggabungkan VUI dengan GUI, sebanding dengan Echo Show.

Apa yang Dapat Dilakukan Pengguna dengan Perintah Suara?

Alexa adalah asisten AI untuk perangkat Amazon yang mendukung suara seperti speaker pintar Echo dan tablet Kindle Fire—Amazon saat ini memimpin dengan teknologi suara (dalam hal penjualan).

Di toko Alexa, beberapa aplikasi paling trendi (disebut "keterampilan") berfokus pada hiburan, terjemahan, dan berita, meskipun pengguna juga dapat melakukan tindakan seperti meminta tumpangan melalui keterampilan Uber, memutar musik melalui keterampilan Spotify, atau bahkan memesan pizza melalui keterampilan Domino.

Contoh menarik lainnya datang dari bank komersial Capital One, yang memperkenalkan keterampilan Alexa pada tahun 2016 dan merupakan bank pertama yang melakukannya. Dengan menambahkan keterampilan Capital One melalui Alexa, pelanggan dapat memeriksa saldo dan tanggal jatuh tempo bahkan melunasi tagihan kartu kredit mereka. PayPal mengambil konsep itu selangkah lebih maju dengan memungkinkan pengguna melakukan pembayaran melalui Siri di iOS atau Apple HomePod, dan ada juga keterampilan Alexa untuk PayPal yang dapat melakukannya.

Tetapi apa yang dapat dilakukan VUI, dan untuk apa pengguna sebenarnya menggunakannya, adalah dua hal yang berbeda.

ComScore menyatakan bahwa lebih dari separuh pengguna yang memiliki speaker pintar menggunakan perangkat mereka untuk mengajukan pertanyaan umum, memeriksa cuaca, dan streaming musik, diikuti dengan mengelola alarm, daftar tugas, dan kalender mereka (perhatikan bahwa tugas-tugas ini cukup dasar secara alami).

Seperti yang Anda lihat, banyak tugas ini melibatkan mengajukan pertanyaan (yaitu, pencarian suara).

Statistik penggunaan speaker pintar di AS
Penggunaan speaker pintar di AS menurut ComScore.

Apa yang Dicari Pengguna dengan Penelusuran Suara?

Sebagian besar orang menggunakan pencarian suara saat mengemudi, meskipun situasi apa pun di mana pengguna tidak dapat menyentuh layar (misalnya, saat memasak atau berolahraga, atau ketika mencoba melakukan banyak tugas di tempat kerja), menawarkan peluang untuk interaksi suara. Inilah rincian lengkapnya oleh HigherVisibility.

Aplikasi suara Android Auto dan antarmuka pengguna suara
Pembaruan lalu lintas real-time menjadi jauh lebih mudah saat mengemudi berkat Google Assistant dan Android Auto.

Melakukan Riset Pengguna untuk Antarmuka Pengguna Suara

Meskipun berguna untuk mengetahui bagaimana pengguna secara umum menggunakan suara, penting bagi desainer UX untuk melakukan riset pengguna mereka sendiri khusus untuk aplikasi VUI yang mereka rancang.

Pemetaan Perjalanan Pelanggan

Riset pengguna adalah tentang memahami kebutuhan, perilaku, dan motivasi pengguna melalui pengamatan dan umpan balik. Peta perjalanan pelanggan yang menyertakan suara sebagai saluran tidak hanya dapat membantu peneliti pengalaman pengguna mengidentifikasi kebutuhan pengguna di berbagai tahap keterlibatan, tetapi juga dapat membantu mereka melihat bagaimana dan di mana suara dapat menjadi metode interaksi.

Dalam skenario bahwa peta perjalanan pelanggan belum dibuat, perancang harus menyoroti di mana interaksi suara akan menjadi faktor dalam alur pengguna (ini dapat disorot sebagai peluang, saluran, atau titik kontak). Jika peta perjalanan pelanggan sudah ada untuk bisnis, maka desainer harus melihat apakah alur pengguna dapat ditingkatkan dengan interaksi suara.

Misalnya, jika pelanggan selalu menanyakan pertanyaan tertentu melalui media sosial atau live support chat, maka mungkin itu percakapan yang dapat diintegrasikan ke dalam aplikasi suara.

Singkatnya, desain harus memecahkan masalah. Gesekan dan frustrasi apa yang dihadapi pengguna selama perjalanan pelanggan?

Analisis Pesaing VUI

Melalui analisis pesaing, desainer harus mencoba mencari tahu apakah dan bagaimana pesaing menerapkan interaksi suara. Pertanyaan kunci untuk ditanyakan adalah:

  • Apa kasus penggunaan untuk aplikasi mereka?
  • Perintah suara apa yang mereka gunakan?
  • Apa yang dikatakan pelanggan dalam ulasan aplikasi dan apa yang dapat kita pelajari dari ini?

Dicari desainer UI lepas penuh waktu yang berbasis di AS ### Pengumpulan Persyaratan

Untuk merancang aplikasi antarmuka pengguna suara, pertama-tama kita perlu mendefinisikan kebutuhan pengguna. Selain membuat peta perjalanan pelanggan dan melakukan analisis pesaing (seperti yang disebutkan di atas), kegiatan penelitian lain seperti wawancara dan pengujian pengguna juga dapat bermanfaat.

Untuk desain VUI, persyaratan tertulis ini lebih penting karena mencakup sebagian besar spesifikasi desain untuk pengembang. Langkah pertama adalah menangkap skenario yang berbeda sebelum mengubahnya menjadi alur dialog percakapan antara pengguna dan asisten suara.

Contoh cerita pengguna untuk aplikasi berita dapat berupa:

“Sebagai pengguna, saya ingin asisten suara membaca artikel berita terbaru sehingga saya dapat mengetahui apa yang terjadi tanpa harus melihat layar saya.”

Dengan mempertimbangkan kisah pengguna ini, kita kemudian dapat merancang alur dialog untuknya.

mengeluarkan perintah suara untuk antarmuka pengguna yang dikendalikan suara

Anatomi Perintah Suara

Sebelum alur dialog dapat dibuat, desainer terlebih dahulu harus memahami anatomi perintah suara. Saat mendesain VUI, desainer terus-menerus perlu memikirkan tujuan interaksi suara (yaitu, Apa yang ingin dicapai pengguna dalam skenario ini? ).

Perintah suara pengguna terdiri dari tiga faktor utama: maksud , ucapan , dan slot .

Mari kita analisis permintaan berikut: “Mainkan musik santai di Spotify.”

Intent (Tujuan Interaksi Suara)

Maksud mewakili tujuan yang lebih luas dari perintah suara pengguna, dan ini dapat berupa interaksi utilitas rendah atau utilitas tinggi .

Interaksi utilitas tinggi adalah tentang melakukan tugas yang sangat spesifik, seperti meminta lampu di ruang duduk dimatikan, atau agar pancuran memiliki suhu tertentu. Merancang permintaan ini sangat mudah karena sangat jelas apa yang diharapkan dari asisten AI.

Permintaan utilitas rendah lebih kabur dan lebih sulit untuk diuraikan. Misalnya, jika pengguna ingin mendengar lebih banyak tentang Amsterdam, pertama-tama kami ingin memeriksa apakah ini sesuai dengan cakupan layanan atau tidak, lalu mengajukan lebih banyak pertanyaan kepada pengguna untuk lebih memahami permintaan tersebut.

Dalam contoh yang diberikan, maksudnya jelas: Pengguna ingin mendengar musik.

Ucapan (Bagaimana Pengguna Mengucapkan Perintah)

Sebuah ucapan mencerminkan bagaimana pengguna mengungkapkan permintaan mereka. Dalam contoh yang diberikan, kita tahu bahwa pengguna ingin memutar musik di Spotify dengan mengatakan “Mainkan saya…,” tetapi ini bukan satu-satunya cara pengguna dapat membuat permintaan ini. Misalnya, pengguna juga dapat mengatakan, “Saya ingin mendengar musik ….”

Desainer perlu mempertimbangkan setiap variasi ucapan. Ini akan membantu mesin AI mengenali permintaan dan menautkannya ke tindakan atau respons yang tepat.

Slot (Variabel Wajib atau Opsional)

Terkadang niat saja tidak cukup dan lebih banyak informasi diperlukan dari pengguna untuk memenuhi permintaan. Alexa menyebutnya "slot", dan slot seperti bidang formulir tradisional dalam arti bahwa mereka dapat opsional atau diperlukan, tergantung pada apa yang diperlukan untuk menyelesaikan permintaan.

Dalam kasus kami, slotnya "santai", tetapi karena permintaan masih dapat diselesaikan tanpanya, slot ini opsional. Namun, jika pengguna ingin memesan taksi, slot akan menjadi tujuan, dan itu akan diperlukan. Input opsional menimpa nilai default apa pun; misalnya, pengguna yang meminta taksi untuk tiba pada jam 4 sore akan menimpa nilai default “sesegera mungkin”.

Membuat Prototipe Percakapan VUI dengan Alur Dialog

Desainer prototipe perlu berpikir seperti penulis naskah dan alur dialog desain untuk masing-masing persyaratan ini. Alur dialog adalah penyampaian yang menguraikan hal-hal berikut:

  • Kata kunci yang mengarah pada interaksi
  • Cabang yang mewakili ke mana percakapan dapat mengarah
  • Contoh dialog untuk pengguna dan asisten

Alur dialog adalah skrip yang menggambarkan percakapan bolak-balik antara pengguna dan asisten suara. Alur dialog seperti prototipe, dan dapat digambarkan sebagai ilustrasi (seperti pada contoh di bawah), atau ada aplikasi prototipe yang dapat digunakan untuk membuat alur dialog.

Ilustrasi alur dialog untuk desain VUI
Contoh alur dialog yang mengilustrasikan maksud, slot, dan keseluruhan percakapan.

Aplikasi untuk Membuat Prototipe VUI

Setelah Anda memetakan alur dialog, Anda siap untuk membuat prototipe interaksi suara menggunakan aplikasi. Beberapa alat prototipe telah memasuki pasar; misalnya, Sayspring memudahkan desainer untuk membuat prototipe yang berfungsi untuk aplikasi Amazon dan Google yang diaktifkan dengan suara.

Membuat prototipe aplikasi VUI dengan Sayspring
Sayspring adalah alat yang memudahkan untuk membuat prototipe Alexa Skill atau Google Home Action.

Amazon juga menawarkan Alexa Skill Builder mereka sendiri, yang memudahkan desainer untuk membuat Alexa Skills baru. Google menawarkan SDK; namun, ini ditujukan untuk pengembang Google Action . Apple belum meluncurkan alat pesaing mereka, tetapi mereka akan segera meluncurkan SiriKit.

Amazon
Alexa Skill Builder dari Amazon, tempat desainer dapat membuat prototipe VUI untuk perangkat yang mendukung Alexa.

Analisis UX untuk Aplikasi Suara

Setelah Anda meluncurkan "keterampilan" untuk Alexa (atau "tindakan" untuk Google), Anda dapat melacak bagaimana aplikasi digunakan dengan analitik. Kedua perusahaan menawarkan alat analitik bawaan; namun, Anda juga dapat mengintegrasikan layanan pihak ketiga untuk analisis yang lebih rumit (seperti voicelabs.co untuk Amazon Alexa, atau dashbot.io untuk Asisten Google). Beberapa metrik utama yang harus diperhatikan adalah:

  • Metrik keterlibatan, seperti sesi per pengguna atau pesan per sesi
  • Bahasa yang digunakan
  • Aliran perilaku
  • Pesan, maksud, dan ucapan

Alexa
Dasbor Alexa Metrics Amazon menampilkan metrik seperti sesi, ucapan, dan maksud.

Tips Praktis untuk Desain VUI

Jaga Komunikasi Tetap Sederhana dan Percakapan

Saat merancang aplikasi seluler dan situs web, perancang harus memikirkan informasi apa yang utama, dan informasi apa yang sekunder (yaitu, tidak begitu penting). Pengguna tidak ingin merasa kelebihan beban, tetapi pada saat yang sama, mereka membutuhkan informasi yang cukup untuk menyelesaikan tugas mereka.

Dengan suara, desainer harus lebih berhati-hati karena hanya kata-kata (dan mungkin GUI yang relatif sederhana) yang dapat digunakan untuk berkomunikasi. Ini membuatnya sangat sulit dalam hal menyampaikan informasi dan data yang kompleks. Ini berarti bahwa lebih sedikit kata lebih baik, dan desainer perlu memastikan bahwa aplikasi memenuhi tujuan pengguna dan tetap benar-benar percakapan.

Konfirmasi Ketika Tugas Telah Selesai

Saat merancang alur pembayaran eCommerce, salah satu layar utama adalah konfirmasi akhir. Ini memberi tahu pelanggan bahwa transaksi telah berhasil dicatat.

Konsep yang sama berlaku untuk desain VUI. Misalnya, jika pengguna berada di ruang duduk meminta asisten suara mereka untuk mematikan lampu di kamar mandi, tanpa konfirmasi, mereka harus berjalan ke ruang duduk dan memeriksa, mengalahkan objek "lepas tangan". ” Aplikasi VUI sepenuhnya.

Dalam skenario ini, respons "Lampu kamar mandi dimatikan" akan baik-baik saja.

Buat Strategi Kesalahan yang Kuat

Sebagai desainer VUI, penting untuk memiliki strategi kesalahan yang kuat. Selalu rancang skenario di mana asisten tidak mengerti atau tidak mendengar apa-apa sama sekali. Analytics juga dapat digunakan untuk mengidentifikasi belokan yang salah dan salah tafsir sehingga strategi kesalahan dapat ditingkatkan.

Beberapa pertanyaan kunci untuk ditanyakan saat memeriksa dialog alternatif:

  • Sudahkah Anda mengidentifikasi tujuan interaksi?
  • Bisakah AI menafsirkan informasi yang diucapkan oleh pengguna?
  • Apakah AI memerlukan lebih banyak informasi dari pengguna untuk memenuhi permintaan?
  • Apakah kami dapat memberikan apa yang diminta pengguna?

Tambahkan Lapisan Keamanan Ekstra

Asisten Google, Siri, dan Alexa sekarang dapat mengenali suara individu. Ini menambahkan lapisan keamanan yang mirip dengan ID Wajah atau ID Sentuh. Perangkat lunak pengenalan suara terus meningkat, dan semakin sulit untuk meniru suara; namun, pada saat ini, mungkin tidak cukup aman dan otentikasi tambahan mungkin diperlukan. Saat bekerja dengan data sensitif, desainer mungkin perlu menyertakan langkah autentikasi tambahan seperti sidik jari, kata sandi, atau pengenalan wajah. Hal ini terutama berlaku dalam hal pesan pribadi dan pembayaran.

Asisten suara Duer dengan perangkat lunak pengenalan wajah
Asisten suara Duer Baidu digunakan di beberapa restoran KFC dan menggunakan pengenalan wajah untuk membuat saran makanan berdasarkan usia atau pesanan sebelumnya.

Fajar Revolusi VUI

VUI akan tetap ada dan akan diintegrasikan ke dalam lebih banyak produk di tahun-tahun mendatang. Beberapa memprediksi kita tidak akan menggunakan keyboard dalam 10 tahun untuk berinteraksi dengan komputer.

Namun, ketika kita memikirkan "pengalaman pengguna", kita cenderung memikirkan apa yang dapat kita lihat dan sentuh. Akibatnya, suara sebagai metode interaksi jarang dipertimbangkan. Namun, suara dan visual tidak saling eksklusif saat merancang pengalaman pengguna—keduanya menambah nilai.

Riset pengguna perlu menjawab pertanyaan apakah suara akan meningkatkan UX atau tidak dan, dengan mempertimbangkan seberapa cepat pangsa pasar untuk perangkat yang mendukung suara meningkat, melakukan riset ini dapat menghabiskan waktu dan secara signifikan meningkatkan nilai dan kualitas sebuah aplikasi.

• • •

Bacaan lebih lanjut di Blog Desain Toptal:

  • eCommerce UX – Tinjauan Praktik Terbaik (dengan Infografis)
  • Pentingnya Desain yang Berpusat pada Manusia dalam Desain Produk
  • Portofolio Desainer UX Terbaik – Studi Kasus dan Contoh yang Menginspirasi
  • Prinsip Heuristik untuk Antarmuka Seluler
  • Desain Antisipatif: Cara Membuat Pengalaman Pengguna yang Ajaib