Цифры не должны лгать — обзор распространенных ошибок визуализации данных
Опубликовано: 2022-03-11Количественные данные бесполезны без интерпретации. Визуализация данных синтезирует значение необработанных данных в последовательные выводы. Когда дизайнеры отдают предпочтение привлекательным изображениям, а не точности, визуализация обманчива. Чтобы передавать данные с целостностью, дизайнеры должны избегать распространенных ошибок визуализации данных.
Если вы будете пытать данные достаточно долго, они расскажут вам о чем угодно. Джон В. Тьюки
Джон Уайлдер Тьюки был человеком, преданным данным. Один из основателей статистического отдела Принстона и изобретатель термина « программное обеспечение » Тьюки любил «брать скучные, однообразные данные и воплощать их в жизнь посредством визуализации». Но, несмотря на всю свою увлеченность цифрами, Тьюки прекрасно понимал, как неверно истолковываются данные, и даже предупреждал: «Визуализация часто используется во зло».
Двойной потенциал добра и зла не уникален для визуализации данных, но это неотложное соображение при проектировании, учитывая парадокс нынешнего века. Информация более обильна и доступна, чем когда-либо, однако правительство, СМИ и бизнес не доверяют многим. Когда организации публикуют вводящие в заблуждение визуализации (преднамеренно или нет), разрыв в доверии увеличивается.
Какие факторы дизайна делают визуализацию обманчивой и как дизайнеры могут передать смысл данных с предельной ясностью?

Белые пятна в визуализации данных
«Графическое совершенство — это то, что дает зрителю наибольшее количество идей в кратчайшее время с наименьшим количеством чернил в наименьшем пространстве». — Эдвард Р. Тафте, Визуальное отображение количественной информации.
Человеческое зрение и познание являются одними из самых невероятных явлений в природе:
- Свет попадает в глаз.
- Хрусталик посылает информацию от света на сетчатку.
- Сетчатка переводит информацию и запускает сигналы по зрительному нерву.
- Зрительный нерв передает мозгу 20 мегабит в секунду.
Скачок от видения к мышлению происходит мгновенно, и мозг, переполненный телесными требованиями и внешними раздражителями, должен экономить энергию, расставляя приоритеты в том, что расшифровывать, а что игнорировать.
В этом быстром стыке видения и понимания визуализация данных доказывает свою ценность. Здесь многие визуализации говорят зрителям, что они «должны» увидеть в данных, и переутомленный мозг одобрительно кивает. Предвзятость подтверждения берет верх. Объективность теряется.
Честно говоря, вводящие в заблуждение визуализации не всегда являются побочным продуктом дурных намерений, но даже честные ошибки дезинформируют зрителей. Глаза впечатлительны, и люди склонны замалчивать информацию в поисках быстрых выводов. Зрение и познание должны быть ключевым фактором при разработке всех визуализаций данных.
10 ошибок визуализации данных, которых следует избегать
1. Вводящий в заблуждение цветовой контраст
Цвет является одним из самых убедительных элементов дизайна. Даже незначительные вариации оттенков вызывают сильные эмоциональные реакции. При визуализации данных высокая степень цветового контраста может заставить зрителей поверить в то, что различия в значениях больше, чем они есть на самом деле.
Например, тепловые карты отображают величину значения цветом. Высокие значения отображаются оранжевым и красным цветом, а более низкие — синим и зеленым. Разница между значениями может быть минимальной, но цветовой контраст создает впечатление тепла и повышенной активности.
Выводы дизайнера:
- Цвет — это больше, чем просто способ различать ряды данных.
- Высококонтрастные сочетания цветов заставляют зрителей воспринимать большую степень несоответствия данных.

2. Неправильное использование 3D-графики
Двумерные представления трехмерного пространства веками очаровывали зрителей, но 3D-графика создает две серьезные проблемы для визуализации данных.
Перекрытие происходит, когда одно трехмерное изображение частично перекрывает другое. Это результат имитации пространства в естественном мире, где объекты имеют разные координаты X, Y и Z. При визуализации данных окклюзия скрывает важные данные и создает ложные иерархии, в которых беспрепятственная графика кажется наиболее важной.
Искажение возникает, когда 3D-графика отступает или проецируется из плоскости изображения из-за ракурса. В рисовании ракурс заставляет объекты казаться обитающими в трехмерном пространстве, но в визуализации данных он создает больше ложных иерархий. Графика переднего плана кажется крупнее, графика фона меньше, а взаимосвязь между рядами данных излишне искажена.
Выводы дизайнера:
- 3D-графика привлекательна, но она потенциально может затруднить важную информацию и запутать масштабные соотношения между рядами данных.
- Если 3D-графика не является абсолютно необходимой, визуализируйте данные в 2D.

3. Слишком много данных
Это вечная проблема дизайна — что включить, а что вырезать в стремлении ясно передать информацию. Визуализация данных не является исключением, особенно когда данных много и они наводят на размышления.
Искушение? Сделайте важный вывод с помощью одной визуализации.
Эта проблема? Люди недостаточно подготовлены для вычисления значения нескольких значений, абстрагированных в визуальной форме.
Когда визуализация включает слишком много данных, информация переполняет, и данные растворяются в графическом супе, который большинство зрителей не может переварить.
Выводы дизайнера:
- Информационная перегрузка касается визуализации данных. Если слишком много представлено сразу, зрители отключаются.
- Может быть более эффективно передавать данные с помощью нескольких визуализаций.

4. Исключение базовых показателей и усечение масштаба
Данные различаются, иногда сильно, например, при измерении уровня доходов или привычек голосования в зависимости от географического региона. Стремясь сделать визуализацию более драматичной или эстетически приятной, дизайнеры могут манипулировать значениями масштаба на графиках.
Типичным примером является пропуск базовой линии или начало оси Y где-то выше нуля, чтобы сделать различия в данных более заметными.
Другим примером является усечение значения X ряда данных, чтобы сделать его сопоставимым с рядами с более низкими значениями.
Выводы дизайнера:
- Эстетическая привлекательность подчинена точному представлению данных.
- Пропуск базовых показателей и усечение шкалы для намеренного преувеличения или сведения к минимуму расхождений в данных неэтично.

5. Предвзятые текстовые описания
Акт внушения – это искусство убеждения. Скажите кому-нибудь, что они должны видеть на изображении, и они, вероятно, увидят. Текст, который сопровождает визуализацию (вспомогательный текст, заголовки, метки, подписи), предназначен для того, чтобы дать зрителям объективный контекст, а не манипулировать их восприятием данных.

Выводы дизайнера:
- Предвзятый текст обычно появляется при построении корреляций между наборами данных (и подразумевает причинно-следственную связь).
- Часто предвзятый текст исходит от клиентов, и дизайнеры должны отметить проблему.
6. Выбор неправильного метода визуализации
Каждый метод визуализации данных имеет свои варианты использования. Например, круговые диаграммы предназначены для сравнения различных частей целого. Они хорошо работают для разбивки бюджета и результатов опросов (одна и та же диаграмма), но не предназначены для сравнения отдельных наборов данных (разные диаграммы).
Круговую диаграмму можно использовать для визуализации доходов трех конкурирующих предприятий, но столбчатая диаграмма сделает различия (или сходства) между предприятиями более очевидными. Если бы визуализация предназначалась для отображения дохода с течением времени, то линейная диаграмма была бы лучшим вариантом, чем гистограмма.
Выводы дизайнера:
- Методы визуализации данных не являются универсальными.
- Знайте переменные, которые визуализация должна сообщать.

7. Запутанные корреляции
Визуализация корреляций между наборами данных — полезный способ дать зрителям более широкое понимание темы. Один из способов показать корреляции — наложить наборы данных на один и тот же график. При тщательном рассмотрении корреляций наложения приводят к ага-моментам. Когда количество оверлеев слишком велико, зрителям трудно установить связи.
Также возможно визуализировать корреляции таким образом, что ложно подразумевается причинно-следственная связь. Известный пример связывает увеличение продаж мороженого с всплеском насильственных преступлений, хотя и то, и другое является результатом теплой погоды.
Выводы дизайнера:
- Может быть полезно выделить корреляции с несколькими визуализациями, которые существуют в непосредственной близости. Это позволяет зрителям оценивать данные и при этом делать соединительные ссылки.
- Стоит повторить. Корреляция не равна причинно-следственной связи.

8. Увеличение благоприятных данных
Данные и время неразделимы. Можно увеличить временные рамки и показать данные, которые благоприятно отразятся на более широких повествованиях. Визуализация финансовых результатов является распространенным виновником. Рассмотрим диаграмму, которая показывает сильные цифры за короткий период, создавая впечатление, что бизнес процветает. К сожалению, уменьшение масштаба показывает, что компания испытала лишь незначительный подъем в резком и продолжительном спаде.
Выводы дизайнера:
- Если увеличенные визуализации не соответствуют тому, что говорят данные в целом, сообщите об этом зрителям.

9. Избегайте общих визуальных ассоциаций
Элементы визуального дизайна воздействуют на психологию человека. Иконки, цветовые схемы и шрифты несут в себе коннотации, влияющие на восприятие зрителя. Когда дизайнеры игнорируют эти ассоциации или избегают их в пользу творческого самовыражения, это редко бывает хорошо.
Анализ визуализаций данных утомляет ум. В критический момент познания мозгу может не понадобиться время, чтобы расшифровать переосмысленное значение знакомых элементов дизайна.
Выводы дизайнера:
- Существует бесчисленное множество способов творчески экспериментировать с визуализацией данных. Не отвлекайте зрителей от данных, заставляя их заново интерпретировать распространенные визуальные ассоциации.

10. Использование визуализации данных в первую очередь
Визуализация данных придает форму числам, которые трудно контекстуализировать. Они раскрывают смысл, когда данные сложны и задействованы несколько переменных. Но визуализация не всегда необходима.
Если данные можно четко и лаконично передать со статистикой, так и должно быть. Если текстовое описание оказывается информативным, а отображение формы данных малоэффективно, визуализация не требуется.
Выводы дизайнера:
- Визуализация данных — это инструмент коммуникации. Как и со всеми инструментами, бывают моменты, когда это уместно, и моменты, когда лучше подходит другой инструмент.

Визуализируйте данные с объективностью
Существует тенденция использовать визуализацию данных как неопровержимое доказательство. «У нас есть данные. Вот что это значит. Конец истории." Тем не менее, великие ученые 20-го века любили неопределенность и принимали тот факт, что даже самые убедительные данные подвержены ошибкам.

Визуализация данных не является утверждением правды. Это аналитические снимки — числовые реальности, оформленные в формах, понятных человеческому глазу. Когда дизайнеры отказываются от украшений, визуализации придают данным теплое сияние объективности и обезоруживают страхи предвзятости и обмана.
Поделитесь с нами вашими мыслями! Пожалуйста, оставьте свои мысли, комментарии и отзывы ниже.
• • •
Дальнейшее чтение в блоге Toptal Design:
- Лучшие примеры визуализации данных и дизайны информационных панелей
- The Mind's Eye — Взгляд на психологию визуализации данных
- Визуализация данных — лучшие практики и основы
- Полный обзор лучших инструментов визуализации данных
- Полное руководство по методам исследования UX