VUI 디자인 – 음성 사용자 인터페이스

게시 됨: 2022-03-11

Apple HomePod, Google Home 및 Amazon Echo와 같은 점점 더 많은 음성 제어 장치가 시장을 강타하고 있습니다. 음성 사용자 인터페이스는 모든 종류의 다양한 사용자 경험을 개선하는 데 도움이 되며 일부에서는 2020년까지 음성이 전체 검색의 50%를 차지할 것이라고 믿습니다.

음성 지원 AI는 거의 모든 것을 순식간에 처리할 수 있습니다.

"내 캘린더의 다음 일정은 무엇입니까?"
“옥스포드 스트리트까지 가는 택시를 예약해 주세요.”
"Spotify에서 재즈 좀 틀어줘!"

마이크로소프트, 구글, 아마존, 애플, 페이스북 등 "빅 5" 기술 회사 5곳 모두 음성 지원 AI 비서를 개발했거나 현재 개발 중입니다. Apple iOS 및 HomePod 장치용 AI 비서인 Siri는 매월 4천만 명 이상의 사용자를 돕고 있으며 ComScore에 따르면 미국 가정 10곳 중 1곳은 오늘날 이미 스마트 스피커를 소유하고 있습니다.

모바일 앱을 위한 VUI(음성 사용자 인터페이스)에 대해 이야기하든 스마트 홈 스피커를 위한 것이든 오늘날의 기술에서는 특히 화면 피로가 문제이기 때문에 음성 상호 작용이 점점 더 보편화되고 있습니다.

사용자는 음성 명령으로 무엇을 할 수 있습니까?

Alexa는 Echo 스마트 스피커 및 Kindle Fire 태블릿과 같은 음성 지원 Amazon 장치를 위한 AI 도우미입니다. Amazon은 현재 음성 기술(판매 측면에서)을 선도하고 있습니다.

Alexa 스토어에서 가장 트렌디한 앱("스킬"이라고 함) 중 일부는 엔터테인먼트, 번역 및 뉴스에 중점을 두고 있지만 사용자는 Uber 기술을 통해 차량 서비스 요청, Spotify 기술을 통해 음악 재생 또는 도미노의 기술을 통해 피자를 주문할 수도 있습니다.

또 다른 흥미로운 예는 2016년 Alexa 기술을 도입한 최초의 은행인 상업 은행인 Capital One에서 찾아볼 수 있습니다. Alexa를 통해 Capital One 기술을 추가하면 고객은 잔액과 만기 날짜를 확인하고 신용 카드 청구서를 결제할 수도 있습니다. PayPal은 사용자가 iOS 또는 Apple HomePod에서 Siri를 통해 결제할 수 있도록 하여 개념을 한 단계 더 발전시켰으며, 이를 수행할 수 있는 PayPal용 Alexa 기술도 있습니다.

그러나 VUI 가 할 수 있는 것과 사용자가 실제로 VUI를 사용하는 것은 별개입니다.

ComScore는 스마트 스피커를 소유한 사용자의 절반 이상이 일반적인 질문을 하고, 날씨를 확인하고, 음악을 스트리밍하는 데 기기를 사용하며, 그 다음이 알람, 할 일 목록 및 캘린더를 관리하는 데 사용한다고 밝혔습니다. 본질적으로 기본).

보시다시피, 이러한 작업의 대부분에는 질문(예: 음성 검색)이 포함됩니다.

미국의 스마트 스피커 사용 통계 — ComScore에 따르면 미국의 스마트 스피커 사용.

사용자는 음성 검색으로 무엇을 검색합니까?

사람들은 운전할 때 주로 음성 검색을 사용하지만 사용자가 화면을 터치할 수 없는 상황(예: 요리나 운동 중, 직장에서 멀티태스킹을 시도할 때)은 음성 상호 작용의 기회를 제공합니다. 다음은 HigherVisibility의 전체 분석입니다.

Android Auto 음성 앱 및 음성 사용자 인터페이스 — Google 어시스턴트와 Android Auto 덕분에 운전 중 실시간 교통정보 업데이트가 훨씬 쉬워졌습니다.

음성 사용자 인터페이스에 대한 사용자 연구 수행

사용자가 일반적으로 음성을 어떻게 사용하는지 아는 것이 유용하지만 UX 디자이너는 자신이 디자인하는 VUI 앱과 관련된 자체 사용자 연구를 수행하는 것이 중요합니다.

고객 여정 매핑

사용자 연구는 관찰과 피드백을 통해 사용자의 요구, 행동 및 동기를 이해하는 것입니다. 음성을 채널로 포함하는 고객 여정 지도는 사용자 경험 연구원이 다양한 참여 단계에서 사용자의 요구를 식별하는 데 도움이 될 뿐만 아니라 음성이 상호 작용 방법과 위치를 파악할 수 있도록 도와줍니다.

고객 여정 지도가 아직 생성되지 않은 시나리오에서 디자이너는 음성 상호 작용이 사용자 흐름에 영향을 미치는 위치를 강조 표시해야 합니다(이는 기회, 채널 또는 접점으로 강조될 수 있음). 비즈니스에 대한 고객 여정 맵이 이미 존재하는 경우 디자이너는 음성 상호 작용으로 사용자 흐름을 개선할 수 있는지 확인해야 합니다.

예를 들어 고객이 항상 소셜 미디어나 실시간 지원 채팅을 통해 특정 질문을 하는 경우 음성 앱에 통합할 수 있는 대화일 수 있습니다.

요컨대 디자인은 문제를 해결해야 합니다. 고객 여정 중에 사용자가 겪는 마찰과 좌절은 무엇입니까?

VUI 경쟁사 분석

경쟁자 분석을 통해 디자이너는 경쟁자가 음성 상호 작용을 구현하는지 여부와 방법을 알아 내려고 노력해야 합니다. 주요 질문은 다음과 같습니다.

앱의 사용 사례는 무엇입니까?
그들은 어떤 음성 명령을 사용합니까?
고객은 앱 리뷰에서 무엇을 말하고 있으며 이를 통해 무엇을 배울 수 있습니까?

미국에 기반을 둔 풀타임 프리랜서 UI 디자이너 구함 ### 요구 사항 수집

음성 사용자 인터페이스 앱을 디자인하려면 먼저 사용자의 요구 사항을 정의해야 합니다. 위에서 언급한 것처럼 고객 여정 지도를 만들고 경쟁사 분석을 수행하는 것 외에도 인터뷰 및 사용자 테스트와 같은 다른 연구 활동도 유용할 수 있습니다.

VUI 디자인의 경우 이러한 서면 요구 사항은 개발자를 위한 대부분의 디자인 사양을 포함하므로 더욱 중요합니다. 첫 번째 단계는 사용자와 음성 도우미 간의 대화식 대화 흐름으로 전환하기 전에 다양한 시나리오를 캡처하는 것입니다.

뉴스 애플리케이션에 대한 사용자 스토리의 예는 다음과 같습니다.

"사용자로서 저는 음성 비서가 최신 뉴스 기사를 읽어서 화면을 보지 않고도 무슨 일이 일어나고 있는지 업데이트할 수 있기를 바랍니다."

이 사용자 스토리를 염두에 두고 대화 흐름을 디자인할 수 있습니다.

음성 명령의 구조

대화 흐름을 만들기 전에 디자이너는 먼저 음성 명령의 구조를 이해해야 합니다. VUI를 디자인할 때 디자이너는 음성 상호 작용의 목적(즉, 사용자가 이 시나리오에서 무엇을 달성하려고 합니까? )에 대해 끊임없이 생각해야 합니다.

사용자의 음성 명령은 Intent , utterance 및 Slot 의 세 가지 핵심 요소로 구성됩니다.

다음 요청을 분석해 보겠습니다. "Spotify에서 편안한 음악 재생"

의도(음성 상호 작용의 목적)

의도는 사용자의 음성 명령의 더 넓은 목표를 나타내며 이는 낮은 유틸리티 또는 높은 유틸리티 상호 작용 일 수 있습니다.

높은 유틸리티 상호 작용 은 거실의 조명을 끄도록 요청하거나 샤워를 특정 온도로 유지하도록 요청하는 것과 같이 매우 특정한 작업을 수행하는 것과 관련됩니다. 이러한 요청을 설계하는 것은 AI 비서에서 기대하는 것이 매우 명확하기 때문에 간단합니다.

낮은 유틸리티 요청 은 더 모호하고 해독하기 어렵습니다. 예를 들어 사용자가 암스테르담에 대해 더 듣고 싶다면 먼저 이것이 서비스 범위에 맞는지 확인한 다음 요청을 더 잘 이해하기 위해 사용자에게 더 많은 질문을 하고 싶습니다.

주어진 예에서 의도는 분명합니다. 사용자는 음악을 듣고 싶어합니다.

발화(사용자가 명령을 표현하는 방법)

발화는 사용자가 요청을 표현 하는 방식을 반영합니다. 주어진 예에서 우리는 사용자가 "Play me..."라고 말하여 Spotify에서 음악을 재생하기를 원한다는 것을 알고 있지만 사용자가 이 요청을 할 수 있는 유일한 방법은 아닙니다. 예를 들어, 사용자는 "나는 음악을 듣고 싶어..."라고 말할 수도 있습니다.

디자이너는 발화의 모든 변형을 고려해야 합니다. 이는 AI 엔진이 요청을 인식하고 이를 올바른 조치 또는 응답에 연결하는 데 도움이 됩니다.

슬롯(필수 또는 선택 변수)

때때로 의도만으로는 충분하지 않고 요청을 이행하기 위해 사용자에게 더 많은 정보가 필요합니다. Alexa는 이것을 "슬롯"이라고 부르며 슬롯은 요청을 완료하는 데 필요한 항목에 따라 선택 사항 또는 필수 항목이 될 수 있다는 점에서 기존 양식 필드와 같습니다.

우리의 경우 슬롯은 "휴식"이지만 요청이 없이도 요청을 완료할 수 있으므로 이 슬롯은 선택 사항입니다. 그러나 사용자가 택시를 예약하려는 경우 슬롯이 목적지가 되며 필수입니다. 선택적 입력은 모든 기본값을 덮어씁니다. 예를 들어, 사용자가 오후 4시에 택시에 도착하도록 요청하면 기본값인 "가능한 한 빨리"를 덮어씁니다.

Dialog Flow로 VUI 대화 프로토타이핑하기

프로토타이핑 디자이너는 각 요구 사항에 대해 스크립트 작성자와 디자인 대화 흐름처럼 생각해야 합니다. 대화 흐름은 다음을 설명하는 결과물입니다.

상호작용으로 이어지는 키워드
대화로 이어질 수 있는 지점을 나타내는 분기
사용자와 어시스턴트 모두를 위한 예시 대화 상자

대화 흐름은 사용자와 음성 도우미 간의 대화를 설명하는 스크립트입니다. 다이얼로그 플로우는 프로토타입과 같으며 그림으로 표현하거나(아래 예시와 같이) 다이얼로그 플로우를 생성하는 데 사용할 수 있는 프로토타입 앱이 있습니다.

VUI 디자인을 위한 대화 흐름의 그림 — 의도, 슬롯 및 전체 대화를 보여주는 샘플 대화 흐름입니다.

VUI 프로토타이핑용 앱

대화 흐름을 매핑했으면 앱을 사용하여 음성 상호 작용을 프로토타이핑할 준비가 된 것입니다. 몇 가지 프로토타이핑 도구가 이미 시장에 진입했습니다. 예를 들어, Sayspring을 사용하면 디자이너가 음성 지원 Amazon 및 Google 앱을 위한 작업 프로토타입을 쉽게 만들 수 있습니다.

Sayspring으로 VUI 앱 프로토타이핑하기 — Sayspring은 Alexa Skill 또는 Google Home Action의 프로토타입을 쉽게 만들 수 있는 도구입니다.

Amazon은 또한 자체 Alexa Skill Builder를 제공하여 디자이너가 새로운 Alexa Skill을 쉽게 생성할 수 있도록 합니다. Google은 SDK를 제공합니다. 그러나 이것은 Google Action 개발자 를 대상으로 합니다. Apple은 아직 경쟁 도구를 출시하지 않았지만 곧 SiriKit을 출시할 예정입니다.

음성 앱용 UX 분석

Alexa에 대한 "스킬"(또는 Google에 대한 "액션")을 출시하면 앱이 분석과 함께 사용되는 방식을 추적할 수 있습니다. 두 회사 모두 내장된 분석 도구를 제공합니다. 그러나 보다 정교한 분석을 위해 타사 서비스를 통합할 수도 있습니다(예: Amazon Alexa의 경우 voicelabs.co 또는 Google Assistant의 경우 dashbot.io). 주의해야 할 몇 가지 주요 측정항목은 다음과 같습니다.

사용자당 세션 또는 세션당 메시지와 같은 참여 측정항목
사용 언어
행동 흐름
메시지, 의도 및 발화

알렉사 — Amazon의 Alexa Metrics Dashboard는 세션, 발언, 의도와 같은 지표를 보여줍니다.

VUI 디자인을 위한 실용적인 팁

의사 소통을 단순하고 대화식으로 유지하십시오.

모바일 앱과 웹사이트를 디자인할 때 디자이너는 어떤 정보가 기본이고 어떤 정보가 부차적인지(즉, 중요하지 않은) 생각해야 합니다. 사용자는 과부하를 느끼고 싶지 않지만 동시에 작업을 완료하는 데 충분한 정보가 필요합니다.

음성을 사용하면 디자이너는 훨씬 더 신중해야 합니다. 왜냐하면 단어(그리고 아마도 상대적으로 간단한 GUI)가 의사 소통할 수 있는 전부이기 때문입니다. 이것은 복잡한 정보와 데이터를 전달하는 경우 특히 어렵습니다. 즉, 단어 수가 적을수록 좋으며 디자이너는 앱이 사용자의 목표를 달성하고 엄격하게 대화를 유지하는지 확인해야 합니다.

작업 완료 확인

전자 상거래 결제 흐름을 설계할 때 주요 화면 중 하나가 최종 확인이 될 것입니다. 이를 통해 고객은 거래가 성공적으로 기록되었음을 알 수 있습니다.

VUI 디자인에도 동일한 개념이 적용됩니다. 예를 들어, 사용자가 음성 비서에게 화장실의 불을 끄도록 요청한 거실에 있는 경우 확인 없이 거실로 걸어가 확인해야 하며 "핸드오프 ” VUI 앱 전체.

이 시나리오에서는 "욕실 조명이 꺼졌습니다" 응답이 정상적으로 작동합니다.

강력한 오류 전략 만들기

VUI 디자이너로서 강력한 오류 전략을 갖는 것이 중요합니다. 항상 어시스턴트가 이해하지 못하거나 전혀 들리지 않는 시나리오를 위해 디자인하십시오. 분석은 또한 잘못된 방향과 잘못된 해석을 식별하여 오류 전략을 개선하는 데 사용할 수 있습니다.

대체 대화 상자를 확인할 때 묻는 몇 가지 주요 질문은 다음과 같습니다.

상호작용의 목적을 확인했습니까?
AI가 사용자가 말한 정보를 해석할 수 있습니까?
AI가 요청을 이행하기 위해 사용자로부터 더 많은 정보를 요구합니까?
사용자가 요청한 것을 전달할 수 있습니까?

추가 보안 계층 추가

이제 Google Assistant, Siri 및 Alexa가 개별 음성을 인식할 수 있습니다. 이것은 Face ID 또는 Touch ID와 유사한 보안 계층을 추가합니다. 음성 인식 소프트웨어는 지속적으로 개선되고 있으며 음성을 모방하는 것이 점점 더 어려워지고 있습니다. 그러나 현재로서는 충분히 안전하지 않을 수 있으며 추가 인증이 필요할 수 있습니다. 민감한 데이터로 작업할 때 설계자는 지문, 암호 또는 얼굴 인식과 같은 추가 인증 단계를 포함해야 할 수 있습니다. 이것은 특히 개인 메시지 및 지불의 경우에 해당됩니다.

얼굴 인식 소프트웨어가 있는 Duer 음성 비서 — Baidu의 Duer 음성 비서는 여러 KFC 레스토랑에서 사용되며 얼굴 인식을 사용하여 연령 또는 이전 주문을 기반으로 식사 제안을 합니다.

VUI 혁명의 시작

VUI는 계속 존재하며 앞으로 더 많은 제품에 통합될 것입니다. 어떤 사람들은 우리가 10년 안에 컴퓨터와 상호 작용하기 위해 키보드를 사용하지 않을 것이라고 예측합니다.

그럼에도 불구하고 우리는 "사용자 경험"을 생각할 때 우리가 보고 만질 수 있는 것에 대해 생각하는 경향이 있습니다. 결과적으로, 상호작용의 방법으로서의 음성은 거의 고려되지 않습니다. 그러나 음성과 영상은 사용자 경험을 디자인할 때 상호 배타적이지 않으며 둘 다 가치를 추가합니다.

사용자 연구는 음성이 UX를 개선할 것인지 여부에 대한 질문에 답해야 하며, 음성 지원 장치의 시장 점유율이 얼마나 빠르게 상승하고 있는지를 고려할 때 이 연구를 수행하는 것은 시간 가치가 있고 가치와 품질을 크게 높일 수 있습니다. 앱.

• • •

Toptal Design 블로그에 대한 추가 정보:

전자 상거래 UX – 모범 사례 개요(인포그래픽 포함)
제품 디자인에서 인간 중심 디자인의 중요성
최고의 UX 디자이너 포트폴리오 – 영감을 주는 사례 연구 및 사례
모바일 인터페이스에 대한 경험적 원리
예측적 디자인: 마법 같은 사용자 경험을 만드는 방법