تصميم واجهة المستخدم الصوتية VUI
نشرت: 2022-03-11المزيد والمزيد من الأجهزة التي يتم التحكم فيها بالصوت ، مثل Apple HomePod و Google Home و Amazon Echo ، تداهم السوق. تساعد واجهات المستخدم الصوتية في تحسين جميع أنواع تجارب المستخدم المختلفة ، ويعتقد البعض أن الصوت سيشغل 50٪ من جميع عمليات البحث بحلول عام 2020.
يمكن للذكاء الاصطناعي الذي يدعم الصوت أن يهتم بأي شيء تقريبًا في لحظة.
- "ما التالي في التقويم الخاص بي؟"
- "احجز لي سيارة أجرة إلى شارع أكسفورد."
- "شغّل لي بعض موسيقى الجاز على Spotify!"
قامت جميع شركات التكنولوجيا الخمس الكبرى - Microsoft و Google و Amazon و Apple و Facebook - بتطوير (أو تقوم حاليًا بتطوير) مساعدين للذكاء الاصطناعي ممكّنين بالصوت. يساعد Siri ، مساعد AI لأجهزة Apple iOS و HomePod ، أكثر من 40 مليون مستخدم شهريًا ، ووفقًا لشركة ComScore ، تمتلك واحدة من كل 10 أسر في الولايات المتحدة مكبر صوت ذكي اليوم.
سواء كنا نتحدث عن VUI (واجهات المستخدم الصوتية) لتطبيقات الأجهزة المحمولة أو لمكبرات الصوت المنزلية الذكية ، أصبحت التفاعلات الصوتية أكثر شيوعًا في تكنولوجيا اليوم ، خاصة وأن إجهاد الشاشة يمثل مصدر قلق.
ما الذي يمكن للمستخدمين فعله بالأوامر الصوتية؟
Alexa هو مساعد AI لأجهزة Amazon التي تدعم الصوت مثل مكبر الصوت Echo الذكي وجهاز Kindle Fire اللوحي - تتصدر Amazon حاليًا الطريق في مجال تقنية الصوت (من حيث المبيعات).
في متجر Alexa ، تركز بعض التطبيقات الأكثر حداثة (تسمى "المهارات") على الترفيه والترجمة والأخبار ، على الرغم من أنه يمكن للمستخدمين أيضًا تنفيذ إجراءات مثل طلب رحلة عبر مهارة Uber أو تشغيل بعض الموسيقى عبر مهارة Spotify أو حتى طلب البيتزا عن طريق مهارة Domino.
مثال آخر مثير للاهتمام يأتي من البنك التجاري Capital One ، الذي قدم مهارة Alexa في عام 2016 وكان أول بنك يقوم بذلك. من خلال إضافة مهارة Capital One عبر Alexa ، يمكن للعملاء التحقق من رصيدهم وتواريخ الاستحقاق وحتى تسوية فاتورة بطاقة الائتمان الخاصة بهم. اتخذ PayPal هذا المفهوم خطوة إلى الأمام من خلال السماح للمستخدمين بإجراء مدفوعات عبر Siri على iOS أو Apple HomePod ، وهناك أيضًا مهارة Alexa لـ PayPal يمكنها تحقيق ذلك.
ولكن ما يمكن أن تفعله VUIs ، وما يستخدمه المستخدمون بالفعل من أجله ، هما شيئان مختلفان.
ذكرت ComScore أن أكثر من نصف المستخدمين الذين يمتلكون مكبر صوت ذكي يستخدمون أجهزتهم لطرح الأسئلة العامة ، والتحقق من الطقس ، ودفق الموسيقى ، متبوعة عن كثب بإدارة التنبيه وقائمة المهام والتقويم (لاحظ أن هذه المهام عادلة أساسي بطبيعته).
كما ترى ، تتضمن الكثير من هذه المهام طرح سؤال (أي البحث الصوتي).
ما الذي يبحث عنه المستخدمون باستخدام البحث الصوتي؟
يستخدم الأشخاص في الغالب البحث الصوتي عند القيادة ، على الرغم من أن أي موقف لا يتمكن فيه المستخدم من لمس الشاشة (على سبيل المثال ، عند الطهي أو التمرين ، أو عند محاولة القيام بمهام متعددة في العمل) ، يوفر فرصة للتفاعلات الصوتية. هنا هو التفصيل الكامل من قبل HigherVisibility.
إجراء بحث المستخدم عن واجهات المستخدم الصوتية
على الرغم من أنه من المفيد معرفة كيفية استخدام المستخدمين للصوت بشكل عام ، فمن المهم لمصممي UX إجراء بحث خاص بالمستخدم خاص بتطبيق VUI الذي يقومون بتصميمه.
رسم خرائط رحلة العميل
يدور بحث المستخدم حول فهم احتياجات وسلوكيات ودوافع المستخدم من خلال الملاحظة والتغذية الراجعة. لا يمكن لخريطة رحلة العميل التي تتضمن الصوت كقناة أن تساعد الباحثين في تجربة المستخدم على تحديد احتياجات المستخدمين في مراحل مختلفة من المشاركة فحسب ، بل يمكن أن تساعدهم أيضًا في معرفة كيف وأين يمكن أن يكون الصوت وسيلة للتفاعل.
في السيناريو الذي لم يتم إنشاء خريطة رحلة العميل بعد ، يجب على المصمم إبراز المكان الذي ستؤثر فيه التفاعلات الصوتية في تدفق المستخدم (يمكن تمييز ذلك كفرصة أو قناة أو نقطة اتصال). إذا كانت خريطة رحلة العميل موجودة بالفعل للأعمال ، فيجب على المصممين معرفة ما إذا كان يمكن تحسين تدفق المستخدم من خلال التفاعلات الصوتية.
على سبيل المثال ، إذا كان العملاء يسألون دائمًا سؤالًا معينًا عبر وسائل التواصل الاجتماعي أو الدردشة عبر الدعم المباشر ، فربما تكون هذه محادثة يمكن دمجها في التطبيق الصوتي.
باختصار ، يجب أن يحل التصميم المشكلات. ما هي الإحباطات والإحباطات التي يواجهها المستخدمون أثناء رحلة العميل؟
تحليل منافس VUI
من خلال تحليل المنافسين ، يجب أن يحاول المصممون معرفة ما إذا كان المنافسون ينفذون التفاعلات الصوتية وكيف يقومون بذلك. الأسئلة الرئيسية التي يجب طرحها هي:
- ما هي حالة استخدام التطبيق الخاص بهم؟
- ما هي الأوامر الصوتية التي يستخدمونها؟
- ماذا يقول العملاء في مراجعات التطبيق وماذا يمكن أن نتعلم من هذا؟
### جمع المتطلبات
من أجل تصميم تطبيق واجهة مستخدم صوتية ، نحتاج أولاً إلى تحديد متطلبات المستخدمين. بصرف النظر عن إنشاء خريطة رحلة العميل وإجراء تحليل المنافس (كما هو مذكور أعلاه) ، يمكن أن تكون الأنشطة البحثية الأخرى مثل إجراء المقابلات واختبار المستخدم مفيدة أيضًا.
بالنسبة لتصميم VUI ، تعتبر هذه المتطلبات المكتوبة أكثر أهمية لأنها ستشمل معظم مواصفات التصميم للمطورين. تتمثل الخطوة الأولى في التقاط السيناريوهات المختلفة قبل تحويلها إلى تدفق حوار محادثة بين المستخدم والمساعد الصوتي.
مثال على قصة مستخدم لتطبيق الأخبار يمكن أن يكون:
"بصفتي مستخدمًا ، أريد أن يقرأ المساعد الصوتي آخر المقالات الإخبارية حتى أتمكن من تحديث ما يحدث دون الحاجة إلى إلقاء نظرة على شاشتي."
مع وضع قصة المستخدم هذه في الاعتبار ، يمكننا بعد ذلك تصميم تدفق حوار لها.
تشريح الأمر الصوتي
قبل إنشاء تدفق حوار ، يحتاج المصممون أولاً إلى فهم تشريح الأمر الصوتي. عند تصميم VUIs ، يحتاج المصممون باستمرار إلى التفكير في الهدف من التفاعلات الصوتية (على سبيل المثال ، ما الذي يحاول المستخدم تحقيقه في هذا السيناريو؟ ).
يتكون الأمر الصوتي للمستخدم من ثلاثة عوامل رئيسية: القصد والكلام والفتحة .
دعنا نحلل الطلب التالي: "قم بتشغيل بعض الموسيقى الهادئة على Spotify."
القصد (الهدف من التفاعل الصوتي)
يمثل القصد الهدف الأوسع للأمر الصوتي للمستخدم ، ويمكن أن يكون هذا إما فائدة منخفضة أو تفاعل فائدة مرتفع .
يتعلق تفاعل المنفعة العالية بأداء مهمة محددة للغاية ، مثل طلب إطفاء الأنوار في غرفة الجلوس ، أو أن يكون الدش بدرجة حرارة معينة. يعد تصميم هذه الطلبات أمرًا مباشرًا نظرًا لأنه من الواضح جدًا ما هو متوقع من مساعد AI.
طلبات المنفعة المنخفضة أكثر غموضًا ويصعب فكها. على سبيل المثال ، إذا أراد المستخدم معرفة المزيد عن أمستردام ، فنحن نرغب أولاً في التحقق مما إذا كان هذا يتناسب مع نطاق الخدمة أم لا ، ثم نطرح على المستخدم المزيد من الأسئلة لفهم الطلب بشكل أفضل.
في المثال المعطى ، النية واضحة: يريد المستخدم سماع الموسيقى.
الكلام (كيف يعبر المستخدم عن أمر)
يعكس الكلام كيف يعبر المستخدم عن طلبه . في المثال المعطى ، نعلم أن المستخدم يريد تشغيل الموسيقى على Spotify بقوله "Play me ..." ، ولكن هذه ليست الطريقة الوحيدة التي يمكن للمستخدم من خلالها تقديم هذا الطلب. على سبيل المثال ، يمكن للمستخدم أيضًا أن يقول ، "أريد سماع الموسيقى ..."

يحتاج المصممون إلى النظر في كل اختلاف في الكلام. سيساعد ذلك محرك الذكاء الاصطناعي على التعرف على الطلب وربطه بالإجراء أو الاستجابة الصحيحة.
الفتحات (المتغيرات المطلوبة أو الاختيارية)
في بعض الأحيان ، لا تكفي النية وحدها وتحتاج إلى مزيد من المعلومات من المستخدم من أجل تلبية الطلب. تسمي Alexa هذا بـ "الفتحة" ، وتشبه الفتحات حقول النموذج التقليدية بمعنى أنها يمكن أن تكون اختيارية أو مطلوبة ، اعتمادًا على ما هو مطلوب لإكمال الطلب.
في حالتنا ، الفتحة "مريحة" ، ولكن نظرًا لأنه لا يزال من الممكن إكمال الطلب بدونها ، فإن هذه الفتحة اختيارية. ومع ذلك ، في حالة رغبة المستخدم في حجز سيارة أجرة ، ستكون الفتحة هي الوجهة ، وستكون مطلوبة. المدخلات الاختيارية الكتابة فوق أي قيم افتراضية ؛ على سبيل المثال ، إذا طلب المستخدم سيارة أجرة للوصول الساعة 4 مساءً ، فسيحل محل القيمة الافتراضية "في أقرب وقت ممكن".
النماذج الأولية لمحادثات VUI مع تدفقات الحوار
يحتاج مصممو النماذج الأولية إلى التفكير مثل كاتب السيناريو وتدفقات حوار التصميم لكل من هذه المتطلبات. إن تدفق الحوار هو أحد التسليمات التي توضح ما يلي:
- الكلمات المفتاحية التي تؤدي إلى التفاعل
- الفروع التي تمثل المكان الذي يمكن أن تؤدي إليه المحادثة
- مثال على مربعات الحوار لكل من المستخدم والمساعد
تدفق الحوار هو نص يوضح المحادثة بين المستخدم والمساعد الصوتي. يشبه تدفق الحوار نموذجًا أوليًا ، ويمكن تصويره كتوضيح (كما في المثال أدناه) ، أو هناك تطبيقات نماذج أولية يمكن استخدامها لإنشاء تدفقات حوار.
تطبيقات لنماذج VUIs
بمجرد قيامك بتخطيط تدفقات الحوار ، فأنت على استعداد لتصميم نموذج أولي للتفاعلات الصوتية باستخدام أحد التطبيقات. دخلت بعض أدوات النماذج الأولية إلى السوق بالفعل ؛ على سبيل المثال ، يسهّل Sayspring على المصممين إنشاء نموذج أولي عملي لتطبيقات Amazon و Google التي تدعم الصوت.
تقدم أمازون أيضًا Alexa Skill Builder الخاص بهم ، مما يسهل على المصممين إنشاء مهارات Alexa جديدة. تقدم Google SDK ؛ ومع ذلك ، فإن هذا يستهدف مطوري Google Action. لم تطلق Apple أداتها المنافسة بعد ، لكنها ستطلق قريبًا SiriKit.
تحليلات UX لتطبيقات الصوت
بمجرد طرح "مهارة" لـ Alexa (أو "إجراء" لـ Google) ، يمكنك تتبع كيفية استخدام التطبيق مع التحليلات. تقدم كلتا الشركتين أداة تحليلات مضمنة ؛ ومع ذلك ، يمكنك أيضًا دمج خدمة جهة خارجية للحصول على تحليلات أكثر تفصيلاً (مثل voicelabs.co لـ Amazon Alexa أو dashbot.io لمساعد Google). بعض المقاييس الرئيسية التي يجب الانتباه إليها هي:
- مقاييس التفاعل ، مثل الجلسات لكل مستخدم أو الرسائل لكل جلسة
- اللغات المستخدمة
- تدفقات السلوك
- الرسائل والنوايا والألفاظ
نصائح عملية لتصميم واجهة المستخدم الرسومية
اجعل التواصل بسيطًا وتحاوريًا
عند تصميم تطبيقات الهاتف المحمول ومواقع الويب ، يتعين على المصممين التفكير في ماهية المعلومات الأساسية ، والمعلومات الثانوية (أي ليست بنفس الأهمية). لا يرغب المستخدمون في الشعور بالحمل الزائد ، لكنهم في نفس الوقت يحتاجون إلى معلومات كافية لإكمال مهمتهم.
باستخدام الصوت ، يجب أن يكون المصممون أكثر حرصًا لأن الكلمات (وربما واجهة المستخدم الرسومية البسيطة نسبيًا) هي كل ما يمكن التواصل معه. هذا يجعل الأمر صعبًا بشكل خاص في حالة نقل المعلومات والبيانات المعقدة. هذا يعني أن عدد الكلمات الأقل هو الأفضل ، ويحتاج المصممون إلى التأكد من أن التطبيق يلبي هدف المستخدمين ويظل محادثة بشكل صارم.
قم بالتأكيد عند اكتمال المهمة
عند تصميم تدفق الخروج من التجارة الإلكترونية ، ستكون إحدى الشاشات الرئيسية هي التأكيد النهائي. يتيح ذلك للعميل معرفة أن المعاملة قد تم تسجيلها بنجاح.
ينطبق نفس المفهوم على تصميم VUI. على سبيل المثال ، إذا كان أحد المستخدمين في غرفة الجلوس يطلب من مساعده الصوتي إطفاء الأنوار في الحمام ، دون تأكيد ، فسيلزمه السير إلى غرفة الجلوس والتحقق والتغلب على الهدف من "رفع اليدين" تطبيق VUI بالكامل.
في هذا السيناريو ، ستكون استجابة "أضواء الحمام مطفأة" تعمل بشكل جيد.
قم بإنشاء استراتيجية خطأ قوية
كمصمم VUI ، من المهم أن يكون لديك استراتيجية خطأ قوية. صمم دائمًا للسيناريو حيث لا يفهم المساعد أو لا يسمع أي شيء على الإطلاق. يمكن أيضًا استخدام التحليلات لتحديد المنعطفات الخاطئة والتفسيرات الخاطئة بحيث يمكن تحسين استراتيجية الخطأ.
بعض الأسئلة الرئيسية التي يجب طرحها عند التحقق من وجود مربعات حوار بديلة:
- هل حددت الهدف من التفاعل؟
- هل يمكن للذكاء الاصطناعي تفسير المعلومات التي يتحدث بها المستخدم؟
- هل يتطلب الذكاء الاصطناعي مزيدًا من المعلومات من المستخدم من أجل تلبية الطلب؟
- هل نحن قادرون على تقديم ما يطلبه المستخدم؟
أضف طبقة أمان إضافية
يمكن الآن لمساعد Google و Siri و Alexa التعرف على الأصوات الفردية. يضيف هذا طبقة من الأمان مشابهة لـ Face ID أو Touch ID. يتحسن برنامج التعرف على الصوت باستمرار ، ويصبح من الأصعب والأصعب تقليد الصوت ؛ ومع ذلك ، في هذه اللحظة ، قد لا يكون آمنًا بدرجة كافية وقد تكون هناك حاجة إلى مصادقة إضافية. عند العمل مع البيانات الحساسة ، قد يحتاج المصممون إلى تضمين خطوة مصادقة إضافية مثل بصمة الإصبع أو كلمة المرور أو التعرف على الوجه. هذا صحيح بشكل خاص في حالة الرسائل الشخصية والمدفوعات.
فجر ثورة VUI
VUIs موجودة لتبقى وسيتم دمجها في المزيد والمزيد من المنتجات في السنوات القادمة. يتوقع البعض أننا لن نستخدم لوحات المفاتيح خلال 10 سنوات للتفاعل مع أجهزة الكمبيوتر.
ومع ذلك ، عندما نفكر في "تجربة المستخدم" ، فإننا نميل إلى التفكير فيما يمكننا رؤيته ولمسه. نتيجة لذلك ، نادرًا ما يتم النظر في الصوت كوسيلة للتفاعل. ومع ذلك ، فإن الصوت والمرئيات لا يستبعد أحدهما الآخر عند تصميم تجارب المستخدم - فكلاهما يضيف قيمة.
يحتاج بحث المستخدم إلى الإجابة على السؤال حول ما إذا كان الصوت سيحسن تجربة المستخدم أم لا ، وبالنظر إلى مدى سرعة ارتفاع حصة السوق للأجهزة التي تدعم الصوت ، فإن إجراء هذا البحث قد يستحق الوقت ويزيد بشكل كبير من قيمة وجودة تطبيق.
• • •
مزيد من القراءة على مدونة Toptal Design:
- تجربة مستخدم التجارة الإلكترونية - نظرة عامة على أفضل الممارسات (باستخدام مخطط المعلومات الرسومي)
- أهمية التصميم المتمحور حول الإنسان في تصميم المنتج
- أفضل مجموعات مصممي UX - أمثلة ودراسات حالة ملهمة
- مبادئ ارشادية للواجهات المتنقلة
- التصميم التوقعي: كيفية إنشاء تجارب مستخدم سحرية