谁、什么和为什么——用户测试方法指南
已发表: 2022-03-11用户测试的根本目的是更好地理解和同情数字产品的核心用户。 不幸的是,用户测试通常是事后才想到的。
从卡片分类到可用性研究,用户体验设计中使用的用户测试方法被开发为将用户纳入决策过程。 然而,许多项目仅在利益相关者反馈原型的情况下完成。 这种缺乏用户体验测试的原因有两个:用户测试的负面投资回报率以及范围蔓延的担忧。
用户测试方法的感知投资回报率
从设计师的角度来看,可用性研究的实施不需要加强。 任何曾经目睹人们使用原型执行任务的过程中遇到困难的 UX 设计师都了解用户测试的价值。 不幸的是,大多数高管、工程师和项目经理从未有幸亲眼目睹可用性测试,因此可能需要以另一种方式说服用户测试的重要性。
数据证明投资回报率的提高
可用性与客户忠诚度和购买行为直接相关——NN/g 的 Jakob Nielsen 进行的研究表明,当大约 10% 的重新设计预算用于用户测试方法时,产品可用性平均提高了 135%。
企业案例研究
当用户可以轻松地自行找到他们正在寻找的信息时,它会减少挫败感并改善他们的体验。
每年有数百万用户访问 Mozilla Firefox 支持网站。 许多访问变成了在支持论坛上提出的问题。 通过针对可发现性优化的设计,在迭代设计测试的九周内,Mozilla将支持问题减少了 70% 。
零售案例研究
国际涂料公司多乐士知道,在线销售涂料的主要问题是“涂料干燥后我的墙会是什么样子?” 为了解决这个问题,他们构思了一款名为Dulux Visualizer的增强现实应用程序,以帮助消费者“在绘制之前先描绘它”,并聘请 Webcredible 来构建该应用程序。
通过用户研究、用户旅程映射和可用性测试,Webcredible 团队开发了一款应用程序,将测试仪涂料销量提高了 65%,库存商搜索量提高了 92% 。
范围蠕变厌恶
忽略用户测试的第二个原因与执行人员无关,而与项目经理有关。 几乎每个设计师都听过项目经理说,由于时间紧迫,没有时间进行用户测试。
项目经理只了解对项目很重要的三个组成部分:时间、成本和范围。 拉上一个,另一个会移动。 例如,如果将更多功能添加到项目中,则时间线将延长或添加更多资源。 这就是为什么当设定了时间表时,PM 不愿意让步。 了解这一点,设计师可以通过一些关于可用的不同方法、范围和预算的 UX 教育来对抗这些趋势。 让我们看看用户体验设计师可以用来评估数字产品可用性的一系列用户测试方法。
多种类型的用户测试方法
有许多类型的用户测试,从行为和态度到定性和定量,每个测试都有一定数量的参与者以获得最佳结果。
态度和行为测试总结为“人们所说的”与“人们所做的”。 很多时候,两者是非常不同的。
定性和定量测试被描述为“直接观察”与“间接测量”。 定量测试数据总是会表达一定的数量、数量或范围,而定性测试数据包含有关质量的信息。
这些术语中的每一个都属于形成性或总结性。 伊利诺伊大学教育学名誉教授罗伯特·E·斯泰克的这句话总结得很好: 当客人品尝汤时,这就是总结性的。”
定性行为用户测试
这种类型的用户测试会观察少数参与者在各种情况下的行为,无论是在他们的工作环境中进行正常的日常工作,还是在最近设计的原型中完成任务。 这些测试需要最少的参与者,因此最容易说服项目经理加入。
可用性测试的最佳参与者人数是多少?
根据《 A Mathematical Model of the Finding of Usability Problems 》一书,五名可用性测试参与者将在测试的 UI 中发现 85% 的问题。 为获得最佳结果,应针对总共 15 名参与者进行 3 次设计迭代。
可用性研究通常在产生初始设计后的项目中间进行。 与其等到产品发布后才发现可用性问题,不如在更简单地更改设计规范时使用收集的数据来改进产品。
为了在每个设计迭代中确定建议的五个用户数量,NN/g 对不同的客户进行了 83 次可用性测试,研究范围从 2 到 28 名参与者。 结果显示,在五名参与者之后,只有少数新发现的重复发现显着增加。 最重要的结论是所有的可用性测试至少产生了一些洞察力。

12 位用户在用户体验测试中发现 33 个问题
一个新的癌症幸存者应用程序的开发人员在产品发布日期前三周联系了 Marketade 进行可用性测试。 在两周的时间里,Marketade 对 12 名用户进行了迭代可用性测试:8 名癌症幸存者和 4 名护理人员。 他们的可用性测试发现了 33 个可用性问题,其中 9 个影响很大。
所有这些案例研究最大的共同点是小型测试组可以对产品的最终可用性产生巨大影响。 当证明不需要数百名参与者(和数周时间)来收集有意义的结果时,产品经理、项目经理和其他利益相关者可以更容易地参与用户测试。
定性态度用户测试
对于这个测试,用户体验研究人员调查了一小群参与者,以了解他们对产品、架构或设计的感受。 定性态度测试比定性行为研究需要更多的参与者,但不会更多。
卡片分类
进行了一项研究,以了解所需的卡片分类参与者的最低数量,发现 15 名用户可以通过卡片分类练习快速改进轻型架构,而建议 30 名参与者用于内部网和门户等更宏大的架构。 卡片分类通常在审计信息架构后在项目中间进行。
专门小组
最近的研究表明,有 8 到 10 名参与者的 3 到 6 个焦点小组可以识别数据集中 90% 的主题。 这些焦点小组通常在项目的战略阶段进行。 从参与式设计练习到公开讨论,有许多练习可以与焦点小组参与者一起进行。
定性的态度例子
用户体验公司 Etre 为改进欧洲之星的信息架构付出了巨大的努力。 他们的网站包含 11,000 个网页和 PDF,其中 80 个页面是架构的基础。 Etre 将每个核心页面都变成了一张卡片,用于进行大规模的卡片分类练习。 他们知道每个用户组需要 20 名参与者,但是,对于 9 个用户组,他们的练习包括 180 名参与者,每个参与者整理 80 张卡片,生成 14,400 个要编目的项目!
幸运的是,Etre 利用了一种在线卡片分类资源,该资源自动将数据分类为易于理解的见解。 虽然卡片分类工作只是大型网页设计工作的一个组成部分,但欧洲之星的收入比上一年增加了 24% 或 2600 万英镑,网站流量增加了 2.2%。
定量行为用户测试
对于这种研究类型,至少需要 20 名参与者,而且通常更多。 通过定量研究,用户体验研究人员正在收集的数据中寻找模式,因此参与者越多,数据就越准确。
热图
NN/g 发现需要 39 位用户提供眼动追踪练习所需的热图详细信息。 每个测试页面至少需要 30 组良好的眼动追踪数据,平均需要 39 个实际用户才能获得该数据集(因为眼动追踪技术并不完美)。 热图的眼动追踪通常在执行新设计后执行。
定量研究
推荐至少 20 名参与者进行定量研究。 与可用性测试一样,执行这些研究是为了通过完成一组任务来了解用户的行为方式。 不同之处在于数据的收集方式,即通过远程查看而不是一对一的练习。 它们通常在产品或交互式原型在线托管后执行。
因为这些类型的研究需要更多的用户,他们可能需要更多的时间和更昂贵的进行。 出于这个原因,它们不像许多定性用户测试方法那样常用。
增加用户保留
通过定量研究网站 UserTesting,Evernote 在多种设备上的用户留存率提高了 15%。 通过在 UserTesting.com 上托管他们的产品并利用其多样化的受众,Evernote 能够了解用户在哪里遇到问题。 使用这些类型的用户测试工具对于拥有广泛受众的产品特别有价值,因为这些产品的不同用户反馈是有帮助的。 其他解决方案可能更适用于具有非常具体、已定义的用户集的产品。
定量态度用户测试
参与度最高的测试是量化的态度练习。 目标是了解一大群人对产品的看法,目的是将答案汇编成有意义的图表,以便于使用。
调查
调查参与者因产品群体规模而异。 最佳结果包括 5% 的误差范围(或更少)和至少 95% 的置信水平。 您可以使用样本量计算器来确定所需的参与者数量。
例如,一个人口规模为 100 的小型网站只需要 80 名调查参与者,而一个人口规模为 100,000 的热门网站需要 383 名调查参与者。 调查在项目开始和结束时进行。
定量态度的例子
虽然 Walmart.ca 收集了大量统计网站数据,但在没有客户洞察的情况下,他们的数据只说明了一半。 通过通过网站调查纳入人工数据及其交易数据,沃尔玛能够看到全貌并改进其网站布局,从而将收入增加 13%。
概括
向决策者展示硬数据可以说服他们将资源用于用户测试。 用户是产品的中坚力量,是用户体验设计的真正目的; 实施本文中概述的一些用户测试方法,以收集定性和定量数据,以证明哪些有效,哪些无效应该是每个 UX 设计师的首要任务。
让我们知道您的想法! 请在下方留下您的想法、评论和反馈。
进一步阅读 Toptal 设计博客:
- UX 的真正投资回报率:说服行政套房
- 如何分六步进行可用性测试
- 在不发疯的情况下将可用性测试数据转化为行动
- 如何进行有效的用户体验研究——指南
- 顶级设计师使用的 10 个 UX 可交付成果