ใคร อะไร และทำไม – คู่มือวิธีการทดสอบผู้ใช้
เผยแพร่แล้ว: 2022-03-11วัตถุประสงค์พื้นฐานของการทดสอบผู้ใช้คือเพื่อให้เข้าใจและเข้าใจผู้ใช้หลักของผลิตภัณฑ์ดิจิทัลได้ดีขึ้น น่าเสียดายที่การทดสอบโดยผู้ใช้มักจะต้องคิดภายหลัง
ตั้งแต่การเรียงลำดับการ์ดไปจนถึงการศึกษาการใช้งาน วิธีการทดสอบผู้ใช้ที่ใช้ในการออกแบบ UX ได้รับการพัฒนาให้รวมผู้ใช้ไว้ในกระบวนการตัดสินใจ อย่างไรก็ตาม โครงการจำนวนมากเสร็จสิ้นลงโดยมีเพียงความคิดเห็นของผู้มีส่วนได้ส่วนเสียเกี่ยวกับต้นแบบเท่านั้น การขาดการทดสอบประสบการณ์ผู้ใช้นี้เกิดขึ้นจากสาเหตุสองประการ: การรับรู้ ROI เชิงลบของการทดสอบผู้ใช้ควบคู่ไปกับความกังวลเรื่องขอบเขตการคืบคลาน
ROI ที่รับรู้จากวิธีการทดสอบของผู้ใช้
จากมุมมองของนักออกแบบ การดำเนินการศึกษาการใช้งานไม่จำเป็นต้องมีการเสริมแรง นักออกแบบ UX คนใดก็ตามที่เคยดูผู้คนพยายามทำงานโดยใช้ต้นแบบของตน เข้าใจถึงคุณค่าของการทดสอบโดยผู้ใช้ น่าเสียดายที่ผู้บริหาร วิศวกร และผู้จัดการโครงการส่วนใหญ่ไม่เคยได้รับสิทธิพิเศษที่ได้เห็นการทดสอบความสามารถในการใช้งาน ดังนั้นจึงจำเป็นต้องเชื่อมั่นในความสำคัญของการทดสอบโดยผู้ใช้ในอีกทางหนึ่ง
ข้อมูลพิสูจน์การเพิ่มขึ้นของ ROI
ความสามารถในการใช้งานเชื่อมโยงโดยตรงกับความภักดีของลูกค้าและพฤติกรรมการซื้อ—การศึกษาที่จัดทำโดย Jakob Nielsen จาก NN/g แนะนำว่าเมื่อมีการให้งบประมาณประมาณ 10% ของการออกแบบใหม่กับวิธีการทดสอบของผู้ใช้ ความสามารถในการใช้งานผลิตภัณฑ์โดยเฉลี่ยจะเพิ่มขึ้น 135%
กรณีศึกษาขององค์กร
เมื่อผู้ใช้สามารถค้นหาข้อมูลที่ต้องการได้อย่างง่ายดายด้วยตนเอง จะช่วยลดความยุ่งยากและปรับปรุงประสบการณ์ของพวกเขา
ผู้ใช้หลายล้านคนเข้าชมไซต์สนับสนุนบน Mozilla Firefox ในแต่ละปี การเข้าชมหลายครั้งกลายเป็นคำถามที่ถามในฟอรัมสนับสนุน ด้วยการออกแบบที่ปรับให้เหมาะสมสำหรับการค้นพบได้ ภายในเก้าสัปดาห์ของการทดสอบการออกแบบซ้ำ Mozilla ได้ ลดคำถามการสนับสนุนลง 70%
กรณีศึกษาการขายปลีก
บริษัทสีนานาชาติ Dulux ทราบดีว่าปัญหาหลักในการขายสีทางออนไลน์นั้นเกี่ยวข้องกับคำถามว่า "ผนังของฉันจะเป็นอย่างไรเมื่อสีแห้ง" เพื่อแก้ไขปัญหานี้ พวกเขาสร้างแนวคิดเกี่ยวกับแอปความเป็นจริงเสริมที่เรียกว่า Dulux Visualizer เพื่อช่วยให้ผู้บริโภค "นึกภาพก่อนที่จะทาสี" และจ้าง Webcredible เพื่อสร้างแอปพลิเคชัน
ผ่านการวิจัยผู้ใช้ การทำแผนที่เส้นทางของผู้ใช้ และการทดสอบความสามารถในการใช้งาน ทีม Webcredible ได้สร้างแอปที่ เพิ่มยอดขายของผู้ทดสอบสีขึ้น 65% และการค้นหาสต็อกสินค้าถึง 92%
ขอบเขตความเกลียดชังคืบคลาน
เหตุผลที่สองที่ผู้ใช้มองข้ามการทดสอบนั้นไม่เกี่ยวกับผู้บริหารและผู้จัดการโครงการมากกว่า นักออกแบบเกือบทุกคนเคยได้ยินผู้จัดการโครงการกล่าวว่าเนื่องจากกำหนดเวลาที่แน่นหนาจึงไม่มีเวลาสำหรับการทดสอบผู้ใช้
ผู้จัดการโครงการเข้าใจเพียงสามองค์ประกอบที่สำคัญในโครงการ: เวลา ต้นทุน และขอบเขต ดึงหนึ่งและอีกคนหนึ่งจะเปลี่ยน ตัวอย่างเช่น หากมีการเพิ่มคุณสมบัติเพิ่มเติมในโครงการ ไทม์ไลน์จะขยายออกหรือจะเพิ่มทรัพยากรมากขึ้น นี่คือเหตุผลว่าทำไมเมื่อมีการกำหนดไทม์ไลน์ PM จึงไม่เต็มใจที่จะขยับเขยื้อน เมื่อเข้าใจสิ่งนี้ นักออกแบบสามารถต่อสู้กับแนวโน้มเหล่านี้ได้ด้วยการศึกษา UX เกี่ยวกับวิธีการต่างๆ ที่มีอยู่ ขอบเขต และงบประมาณ มาดูวิธีการทดสอบของผู้ใช้ที่นักออกแบบ UX สามารถใช้เพื่อประเมินความสามารถในการใช้งานของผลิตภัณฑ์ดิจิทัลกัน
วิธีการทดสอบของผู้ใช้หลายประเภท
การทดสอบของผู้ใช้มีหลายประเภท ตั้งแต่พฤติกรรมและทัศนคติไปจนถึงเชิงคุณภาพและเชิงปริมาณ โดยแต่ละแบบมีผู้เข้าร่วมที่กำหนดไว้เพื่อผลลัพธ์ที่ดีที่สุด
การทดสอบทัศนคติและพฤติกรรมสรุปเป็น "สิ่งที่ผู้คนพูด" กับ "สิ่งที่ผู้คนทำ" หลายครั้งที่ทั้งสองแตกต่างกันมาก
การทดสอบเชิงคุณภาพและเชิงปริมาณอธิบายว่า "การสังเกตโดยตรง" กับ "การวัดทางอ้อม" ข้อมูลการทดสอบเชิงปริมาณจะแสดงปริมาณ ปริมาณ หรือช่วงที่แน่นอนเสมอ ในขณะที่ข้อมูลการทดสอบเชิงคุณภาพประกอบด้วยข้อมูลเกี่ยวกับคุณภาพ
ข้อกำหนดแต่ละข้ออยู่ภายใต้การก่อตัวหรือผลรวม ข้อความอ้างอิงจากโรเบิร์ต อี. สเตค ศาสตราจารย์กิตติคุณด้านการศึกษาที่มหาวิทยาลัยอิลลินอยส์ สรุปไว้อย่างดีว่า “เมื่อพ่อครัวชิมซุป เมื่อแขกชิมซุปนั่นเป็นผลสรุป”
การทดสอบผู้ใช้ตามพฤติกรรมเชิงคุณภาพ
การทดสอบผู้ใช้ประเภทนี้จะสังเกตสิ่งที่ผู้เข้าร่วมจำนวนน้อยทำในสถานการณ์ต่างๆ ไม่ว่าจะเป็นในสภาพแวดล้อมการทำงานตามปกติหรือทำงานให้เสร็จสิ้นภายในต้นแบบที่ออกแบบล่าสุด การทดสอบเหล่านี้ต้องการผู้เข้าร่วมจำนวนน้อยที่สุด ดังนั้นจึงเป็นวิธีที่ง่ายที่สุดในการโน้มน้าวให้ผู้จัดการโครงการรวมไว้ด้วย
จำนวนผู้เข้าร่วมการทดสอบความสามารถในการใช้งานที่เหมาะสมที่สุดคืออะไร?
ตามหนังสือ A Mathematical Model of the Finding of Usability Problems ผู้เข้าร่วมการทดสอบความสามารถในการใช้งาน 5 คนจะค้นพบ 85% ของปัญหาภายใน UI ที่ทดสอบ เพื่อผลลัพธ์ที่ดีที่สุด ควรทำโดยทำซ้ำการออกแบบสามครั้ง รวมเป็นผู้เข้าร่วม 15 คน
การศึกษาความสามารถในการใช้งานมักดำเนินการในช่วงกลางของโครงการหลังจากที่มีการออกแบบเริ่มต้นขึ้น แทนที่จะรอหลังจากเปิดตัวผลิตภัณฑ์เพื่อค้นหาปัญหาการใช้งาน ข้อมูลที่รวบรวมมาสามารถนำมาใช้เพื่อปรับปรุงผลิตภัณฑ์ได้เมื่อการเปลี่ยนแปลงข้อกำหนดการออกแบบทำได้ง่ายขึ้น
เพื่อให้เป็นไปตามจำนวนผู้ใช้ที่แนะนำห้ารายต่อการออกแบบซ้ำ NN/g ได้ทำการทดสอบความสามารถในการใช้งาน 83 ครั้งในไคลเอนต์ต่างๆ โดยมีการศึกษาตั้งแต่ผู้เข้าร่วม 2 ถึง 28 คน ผลการวิจัยพบว่ามีการค้นพบซ้ำเพิ่มขึ้นอย่างมีนัยสำคัญโดยมีการค้นพบใหม่เพียงไม่กี่ครั้งหลังจากผู้เข้าร่วมห้าคน ข้อสรุปที่สำคัญที่สุดคือการทดสอบความสามารถในการใช้งานทั้งหมดทำให้เกิด ความ เข้าใจอย่างถ่องแท้
ผู้ใช้ 12 รายค้นพบ 33 ปัญหาเมื่อผู้ใช้ทดสอบประสบการณ์
นักพัฒนาแอปผู้รอดชีวิตจากมะเร็งรายใหม่ติดต่อ Marketade เพื่อทำการทดสอบความสามารถในการใช้งานสามสัปดาห์ก่อนวันเปิดตัวผลิตภัณฑ์ ในช่วงระยะเวลาสองสัปดาห์ Marketade ได้ทำการทดสอบความสามารถในการใช้งานซ้ำกับผู้ใช้ 12 ราย: ผู้รอดชีวิตจากมะเร็ง 8 รายและผู้ดูแล 4 ราย การทดสอบการใช้งานพบว่ามีปัญหาในการใช้งาน 33 รายการ โดย 9 รายการมีปัญหาสูง

สิ่งที่ใหญ่ที่สุดของกรณีศึกษาเหล่านี้ทั้งหมดมีเหมือนกันคือกลุ่มทดสอบขนาดเล็กสามารถมีผลกระทบอย่างมากต่อการใช้งานขั้นสุดท้ายของผลิตภัณฑ์ ผู้จัดการผลิตภัณฑ์ ผู้จัดการโครงการ และผู้มีส่วนได้ส่วนเสียอื่นๆ สามารถนำมาร่วมทดสอบกับผู้ใช้ได้ง่ายขึ้น เมื่อแสดงให้เห็นว่าผู้เข้าร่วมไม่ต้องใช้เวลาหลายร้อยคน (และหลายสัปดาห์) เพื่อรวบรวมผลลัพธ์ที่มีความหมาย
การทดสอบผู้ใช้ทัศนคติเชิงคุณภาพ
สำหรับการทดสอบนี้ นักวิจัย UX จะตรวจสอบผู้เข้าร่วมกลุ่มเล็กๆ เพื่อทำความเข้าใจว่าพวกเขารู้สึกอย่างไรเกี่ยวกับผลิตภัณฑ์ สถาปัตยกรรม หรือการออกแบบ การทดสอบทัศนคติเชิงคุณภาพต้องการผู้เข้าร่วมมากกว่าการศึกษาพฤติกรรมเชิงคุณภาพเพียงเล็กน้อย แต่ไม่มากนัก
การเรียงลำดับการ์ด
การศึกษาได้ดำเนินการเพื่อทำความเข้าใจจำนวนผู้เข้าร่วมการคัดแยกบัตรที่จำเป็นขั้นต่ำ และพบว่าผู้ใช้ 15 รายสามารถปรับปรุงสถาปัตยกรรมแบบเบาได้อย่างรวดเร็วผ่านแบบฝึกหัดการคัดแยกไพ่ ในขณะที่ผู้เข้าร่วม 30 คนได้รับการแนะนำสำหรับสถาปัตยกรรมที่ยิ่งใหญ่กว่า เช่น อินทราเน็ตและพอร์ทัล การเรียงลำดับการ์ดมักจะดำเนินการในช่วงกลางของโปรเจ็กต์หลังจากตรวจสอบสถาปัตยกรรมข้อมูลแล้ว
กลุ่มเป้าหมาย
การวิจัยล่าสุดแสดงให้เห็นว่าการสนทนากลุ่ม 3 ถึง 6 กลุ่มที่มีผู้เข้าร่วม 8 ถึง 10 คนสามารถระบุธีมได้ถึง 90% ภายในชุดข้อมูล การสนทนากลุ่มเหล่านี้มักดำเนินการในช่วงกลยุทธ์ของโครงการ มีแบบฝึกหัดมากมายที่ต้องทำร่วมกับผู้เข้าร่วมกลุ่มสนทนา ตั้งแต่แบบฝึกหัดการออกแบบอย่างมีส่วนร่วมไปจนถึงการอภิปรายแบบเปิด
ตัวอย่างทัศนคติเชิงคุณภาพ
บริษัทประสบการณ์ผู้ใช้ Etre พยายามอย่างมากในการปรับปรุงสถาปัตยกรรมข้อมูล Eurostar เว็บไซต์ของพวกเขามีหน้าเว็บและ PDF จำนวน 11,000 หน้า ซึ่ง 80 หน้าเป็นพื้นฐานของสถาปัตยกรรม Etre เปลี่ยนหน้าหลักแต่ละหน้าให้เป็นการ์ดสำหรับแบบฝึกหัดการคัดแยกไพ่ขนาดใหญ่ พวกเขาเข้าใจถึงความต้องการผู้เข้าร่วม 20 คนต่อกลุ่มผู้ใช้ อย่างไรก็ตาม ด้วยกลุ่มผู้ใช้ 9 กลุ่ม แบบฝึกหัดของพวกเขามีผู้เข้าร่วม 180 คน โดยแต่ละกลุ่มจะจัดเรียงการ์ด 80 ใบ สร้าง 14,400 รายการในแคตตาล็อก!
โชคดีที่ Etre ใช้ประโยชน์จากทรัพยากรการเรียงลำดับการ์ดออนไลน์ที่จัดเรียงข้อมูลให้เป็นข้อมูลเชิงลึกที่ย่อยได้โดยอัตโนมัติ แม้ว่าการคัดแยกบัตรเป็นเพียงองค์ประกอบเดียวในการออกแบบเว็บไซต์ที่ใหญ่ขึ้น แต่ Eurostar พบว่ารายรับเพิ่มขึ้น 24% หรือ 26 ล้านปอนด์จากปีที่แล้ว รวมถึงการเข้าชมเว็บไซต์เพิ่มขึ้น 2.2%
การทดสอบผู้ใช้ตามพฤติกรรมเชิงปริมาณ
สำหรับการศึกษาประเภทนี้ จำเป็นต้องมีผู้เข้าร่วมอย่างน้อย 20 คนและบ่อยครั้งมากขึ้น ด้วยการศึกษาเชิงปริมาณ นักวิจัย UX กำลังมองหารูปแบบภายในข้อมูลที่รวบรวม ดังนั้นยิ่งมีผู้เข้าร่วมมาก ข้อมูลก็จะยิ่งแม่นยำมากขึ้นเท่านั้น
แผนที่ความร้อน
NN/g พบว่าผู้ใช้ 39 รายต้องระบุรายละเอียดแผนที่ความร้อนที่จำเป็นสำหรับการฝึกติดตามดวงตา ต้องมีข้อมูลการติดตามการมองที่ดีอย่างน้อย 30 ชุดสำหรับแต่ละหน้าที่ทดสอบ ซึ่งจะมีผู้ใช้จริงเฉลี่ย 39 ราย เพื่อให้ได้ชุดข้อมูลนั้น (เนื่องจากเทคโนโลยีการติดตามการมองไม่สมบูรณ์แบบ) โดยทั่วไปแล้วการติดตามดวงตาสำหรับแผนที่ความหนาแน่นจะดำเนินการหลังจากดำเนินการออกแบบใหม่
การศึกษาเชิงปริมาณ
แนะนำให้ผู้เข้าร่วมอย่างน้อย 20 คนสำหรับการศึกษาเชิงปริมาณ เช่นเดียวกับการทดสอบความสามารถในการใช้งาน การศึกษาเหล่านี้ดำเนินการเพื่อทำความเข้าใจว่าผู้ใช้มีพฤติกรรมอย่างไรโดยทำชุดของงานให้เสร็จ ความแตกต่างคือวิธีการรวบรวมข้อมูล ซึ่งก็คือการดูจากระยะไกลแทนการฝึกแบบตัวต่อตัว พวกเขามักจะดำเนินการในตอนท้ายหลังจากที่ผลิตภัณฑ์หรือต้นแบบแบบโต้ตอบได้รับการโฮสต์ออนไลน์
เนื่องจากการศึกษาประเภทนี้ต้องการผู้ใช้มากขึ้น จึงอาจต้องใช้เวลาและค่าใช้จ่ายในการดำเนินการมากกว่า ด้วยเหตุผลดังกล่าว จึงมักใช้น้อยกว่าวิธีทดสอบเชิงคุณภาพโดยผู้ใช้หลายๆ วิธี
การรักษาผู้ใช้ที่เพิ่มขึ้น
ผ่านไซต์การวิจัยเชิงปริมาณ UserTesting ทำให้ Evernote เพิ่มการรักษาผู้ใช้ได้ 15% บนอุปกรณ์หลายเครื่อง ด้วยการโฮสต์ผลิตภัณฑ์ของตนบน UserTesting.com และใช้ประโยชน์จากผู้ชมที่หลากหลาย Evernote สามารถเข้าใจจุดที่ผู้ใช้พบปัญหา การใช้เครื่องมือทดสอบผู้ใช้ประเภทนี้มีประโยชน์อย่างยิ่งสำหรับผลิตภัณฑ์ที่มีผู้ชมกว้าง ซึ่งความคิดเห็นของผู้ใช้ที่หลากหลายจะเป็นประโยชน์ โซลูชันอื่นๆ อาจทำงานได้ดีกว่าสำหรับผลิตภัณฑ์ที่มีกลุ่มผู้ใช้ที่กำหนดไว้เฉพาะเจาะจง
การทดสอบผู้ใช้ทัศนคติเชิงปริมาณ
การทดสอบแบบมีส่วนร่วมมากที่สุดคือการฝึกทัศนคติเชิงปริมาณ เป้าหมายคือการทำความเข้าใจว่าบุคคลกลุ่มใหญ่คิดอย่างไรเกี่ยวกับผลิตภัณฑ์ โดยมีเป้าหมายในการรวบรวมคำตอบลงในแผนภูมิและกราฟที่มีความหมายเพื่อการบริโภคที่ง่ายดาย
แบบสำรวจ
ผู้เข้าร่วมการสำรวจแตกต่างกันไปตามขนาดประชากรของผลิตภัณฑ์ ผลลัพธ์ที่เหมาะสมที่สุดรวมถึงส่วนต่างของข้อผิดพลาด 5% (หรือน้อยกว่า) และระดับความมั่นใจอย่างน้อย 95% คุณสามารถใช้เครื่องคำนวณขนาดตัวอย่างเพื่อกำหนดจำนวนผู้เข้าร่วมที่ต้องการได้
ตัวอย่างเช่น เว็บไซต์ขนาดเล็กที่มีขนาดประชากร 100 ต้องการผู้เข้าร่วมการสำรวจเพียง 80 คน ในขณะที่ไซต์ยอดนิยมที่มีขนาดประชากร 100,000 จะต้องมีผู้เข้าร่วมการสำรวจ 383 คน การสำรวจจะดำเนินการทั้งที่จุดเริ่มต้นและจุดสิ้นสุดของโครงการ
ตัวอย่างทัศนคติเชิงปริมาณ
ในขณะที่ Walmart.ca ได้รวบรวมข้อมูลเว็บไซต์ทางสถิติมากมาย โดยที่ข้อมูลของลูกค้าไม่ได้บอกเล่าเรื่องราวเพียงครึ่งเดียว การรวมข้อมูลของมนุษย์ผ่านการสำรวจเว็บไซต์พร้อมกับข้อมูลธุรกรรมของพวกเขา Walmart สามารถเห็นภาพทั้งหมดและปรับปรุงเลย์เอาต์ของเว็บไซต์ ซึ่งส่งผลให้รายได้เพิ่มขึ้น 13%
สรุป
การแสดงข้อมูลที่ชัดเจนของผู้มีอำนาจตัดสินใจสามารถโน้มน้าวให้พวกเขาอุทิศทรัพยากรให้กับการทดสอบของผู้ใช้ ผู้ใช้คือกระดูกสันหลังของผลิตภัณฑ์และจุดประสงค์ที่แท้จริงของการออกแบบประสบการณ์ผู้ใช้ ใช้วิธีการทดสอบผู้ใช้ตามที่ระบุไว้ในบทความนี้เพื่อรวบรวมข้อมูลเชิงคุณภาพและเชิงปริมาณเพื่อพิสูจน์ว่าสิ่งใดใช้ได้ผลและสิ่งใดไม่ควรมีความสำคัญสูงสุดสำหรับผู้ออกแบบ UX ทุกคน
แจ้งให้เราทราบสิ่งที่คุณคิด! โปรดแสดงความคิดเห็น ความคิดเห็น และข้อเสนอแนะของคุณด้านล่าง
อ่านเพิ่มเติมเกี่ยวกับบล็อก Toptal Design:
- ROI ที่แท้จริงของ UX: โน้มน้าวใจ Executive Suite
- วิธีดำเนินการทดสอบความสามารถในการใช้งานในหกขั้นตอน
- เปลี่ยนข้อมูลการทดสอบความสามารถในการใช้งานให้กลายเป็นจริงโดยไม่ต้องเสียสติ
- วิธีดำเนินการวิจัย UX อย่างมีประสิทธิภาพ – คู่มือ
- 10 UX ที่นักออกแบบชั้นนำเลือกใช้