誰、什麼和為什麼——用戶測試方法指南
已發表: 2022-03-11用戶測試的根本目的是更好地理解和同情數字產品的核心用戶。 不幸的是,用戶測試通常是事後才想到的。
從卡片分類到可用性研究,用戶體驗設計中使用的用戶測試方法被開發為將用戶納入決策過程。 然而,許多項目僅在利益相關者反饋原型的情況下完成。 這種缺乏用戶體驗測試的原因有兩個:用戶測試的負面投資回報率以及範圍蔓延的擔憂。
用戶測試方法的感知投資回報率
從設計師的角度來看,可用性研究的實施不需要加強。 任何曾經目睹人們使用原型執行任務的過程中遇到困難的 UX 設計師都了解用戶測試的價值。 不幸的是,大多數高管、工程師和項目經理從未有幸親眼目睹可用性測試,因此可能需要以另一種方式說服用戶測試的重要性。
數據證明投資回報率的提高
可用性與客戶忠誠度和購買行為直接相關——NN/g 的 Jakob Nielsen 進行的研究表明,當大約 10% 的重新設計預算用於用戶測試方法時,產品可用性平均提高 135%。
企業案例研究
當用戶可以輕鬆地自行找到他們正在尋找的信息時,它會減少挫敗感並改善他們的體驗。
每年有數百萬用戶訪問 Mozilla Firefox 支持網站。 許多訪問變成了在支持論壇上提出的問題。 通過針對可發現性優化的設計,在迭代設計測試的九週內,Mozilla將支持問題減少了 70% 。
零售案例研究
國際塗料公司多樂士知道,在線銷售塗料的主要問題是“塗料乾燥後我的牆會是什麼樣子?” 為了解決這個問題,他們構思了一款名為Dulux Visualizer的增強現實應用程序,以幫助消費者“在繪製之前先描繪它”,並聘請 Webcredible 來構建該應用程序。
通過用戶研究、用戶旅程映射和可用性測試,Webcredible 團隊開發了一款應用程序,將測試儀塗料銷量提高了 65%,庫存商搜索量提高了 92% 。
範圍蠕變厭惡
忽略用戶測試的第二個原因與執行人員無關,而與項目經理有關。 幾乎每個設計師都聽過項目經理說,由於時間緊迫,沒有時間進行用戶測試。
項目經理只了解對項目很重要的三個組成部分:時間、成本和範圍。 拉上一個,另一個會移動。 例如,如果將更多功能添加到項目中,則時間線將延長或添加更多資源。 這就是為什麼當設定了時間表時,PM 不願意讓步。 了解這一點,設計師可以通過一些關於可用的不同方法、範圍和預算的 UX 教育來對抗這些趨勢。 讓我們看看用戶體驗設計師可以用來評估數字產品可用性的一系列用戶測試方法。
多種類型的用戶測試方法
有許多類型的用戶測試,從行為和態度到定性和定量,每個測試都有一定數量的參與者以獲得最佳結果。
態度和行為測試總結為“人們所說的”與“人們所做的”。 很多時候,兩者是非常不同的。
定性和定量測試被描述為“直接觀察”與“間接測量”。 定量測試數據總是會表達一定的數量、數量或範圍,而定性測試數據包含有關質量的信息。
這些術語中的每一個都屬於形成性或總結性。 伊利諾伊大學教育學名譽教授羅伯特·E·斯泰克的這句話總結得很好: 當客人品嚐湯時,這就是總結性的。”
定性行為用戶測試
這種類型的用戶測試會觀察少數參與者在各種情況下的行為,無論是在他們的工作環境中進行正常的日常工作,還是在最近設計的原型中完成任務。 這些測試需要最少的參與者,因此最容易說服項目經理加入。
可用性測試的最佳參與者人數是多少?
根據《 A Mathematical Model of the Finding of Usability Problems 》一書,五名可用性測試參與者將在測試的 UI 中發現 85% 的問題。 為獲得最佳結果,應針對總共 15 名參與者進行 3 次設計迭代。
可用性研究通常在產生初始設計後的項目中間進行。 與其等到產品發布後才發現可用性問題,不如在更簡單地更改設計規範時使用收集的數據來改進產品。
為了在每個設計迭代中確定建議的五個用戶數量,NN/g 對不同的客戶進行了 83 次可用性測試,研究範圍從 2 到 28 名參與者。 結果顯示,在五名參與者之後,只有少數新發現的重複發現顯著增加。 最重要的結論是所有的可用性測試至少產生了一些洞察力。

12 位用戶在用戶體驗測試中發現 33 個問題
一個新的癌症倖存者應用程序的開發人員在產品發布日期前三週聯繫了 Marketade 進行可用性測試。 在兩週的時間裡,Marketade 對 12 名用戶進行了迭代可用性測試:8 名癌症倖存者和 4 名護理人員。 他們的可用性測試發現了 33 個可用性問題,其中 9 個影響很大。
所有這些案例研究最大的共同點是小型測試組可以對產品的最終可用性產生巨大影響。 當證明不需要數百名參與者(和數週時間)來收集有意義的結果時,產品經理、項目經理和其他利益相關者可以更容易地參與用戶測試。
定性態度用戶測試
對於這個測試,用戶體驗研究人員調查了一小群參與者,以了解他們對產品、架構或設計的感受。 定性態度測試比定性行為研究需要更多的參與者,但不會更多。
卡片分類
進行了一項研究,以了解所需的卡片分類參與者的最低數量,發現 15 名用戶可以通過卡片分類練習快速改進輕型架構,而建議 30 名參與者用於內部網和門戶等更宏大的架構。 卡片分類通常在審計信息架構後在項目中間進行。
專門小組
最近的研究表明,有 8 到 10 名參與者的 3 到 6 個焦點小組可以識別數據集中 90% 的主題。 這些焦點小組通常在項目的戰略階段進行。 從參與式設計練習到公開討論,有許多練習可以與焦點小組參與者一起進行。
定性的態度例子
用戶體驗公司 Etre 為改進歐洲之星的信息架構付出了巨大的努力。 他們的網站包含 11,000 個網頁和 PDF,其中 80 個頁面是架構的基礎。 Etre 將每個核心頁面都變成了一張卡片,用於進行大規模的卡片分類練習。 他們知道每個用戶組需要 20 名參與者,但是,對於 9 個用戶組,他們的練習包括 180 名參與者,每個參與者整理 80 張卡片,生成 14,400 個要編目的項目!
幸運的是,Etre 利用了一種在線卡片分類資源,該資源自動將數據分類為易於理解的見解。 雖然卡片分類工作只是大型網頁設計工作的一個組成部分,但歐洲之星的收入比上一年增加了 24% 或 2600 萬英鎊,網站流量增加了 2.2%。
定量行為用戶測試
對於這種研究類型,至少需要 20 名參與者,而且通常更多。 通過定量研究,用戶體驗研究人員正在收集的數據中尋找模式,因此參與者越多,數據就越準確。
熱圖
NN/g 發現需要 39 位用戶提供眼動追踪練習所需的熱圖詳細信息。 每個測試頁面至少需要 30 組良好的眼動追踪數據,平均需要 39 個實際用戶才能獲得該數據集(因為眼動追踪技術並不完美)。 熱圖的眼動追踪通常在執行新設計後執行。
定量研究
推薦至少 20 名參與者進行定量研究。 與可用性測試一樣,執行這些研究是為了通過完成一組任務來了解用戶的行為方式。 不同之處在於數據的收集方式,即通過遠程查看而不是一對一的練習。 它們通常在產品或交互式原型在線託管後執行。
因為這些類型的研究需要更多的用戶,他們可能需要更多的時間和更昂貴的進行。 出於這個原因,它們不像許多定性用戶測試方法那樣常用。
增加用戶保留
通過定量研究網站 UserTesting,Evernote 在多種設備上的用戶留存率提高了 15%。 通過在 UserTesting.com 上託管他們的產品並利用其多樣化的受眾,Evernote 能夠了解用戶在哪裡遇到問題。 使用這些類型的用戶測試工具對於擁有廣泛受眾的產品特別有價值,因為這些產品的不同用戶反饋是有幫助的。 其他解決方案可能更適用於具有非常具體、已定義的用戶集的產品。
定量態度用戶測試
參與度最高的測試是量化的態度練習。 目標是了解一大群人對產品的看法,目的是將答案彙編成有意義的圖表,以便於使用。
調查
調查參與者因產品群體規模而異。 最佳結果包括 5% 的誤差範圍(或更少)和至少 95% 的置信水平。 您可以使用樣本量計算器來確定所需的參與者數量。
例如,一個人口規模為 100 的小型網站只需要 80 名調查參與者,而一個人口規模為 100,000 的熱門網站需要 383 名調查參與者。 調查在項目開始和結束時進行。
定量態度的例子
雖然 Walmart.ca 收集了大量統計網站數據,但在沒有客戶洞察的情況下,他們的數據只說明了一半。 通過通過網站調查納入人工數據及其交易數據,沃爾瑪能夠看到全貌並改進其網站佈局,從而將收入增加 13%。
概括
向決策者展示硬數據可以說服他們將資源用於用戶測試。 用戶是產品的中堅力量,是用戶體驗設計的真正目的; 實施本文中概述的一些用戶測試方法,以收集定性和定量數據,以證明哪些有效,哪些無效應該是每個 UX 設計師的首要任務。
讓我們知道您的想法! 請在下方留下您的想法、評論和反饋。
進一步閱讀 Toptal 設計博客:
- UX 的真正投資回報率:說服行政套房
- 如何分六步進行可用性測試
- 在不發瘋的情況下將可用性測試數據轉化為行動
- 如何進行有效的用戶體驗研究——指南
- 頂級設計師使用的 10 個 UX 可交付成果