[Перевод] Худшая диаграмма на свете

Всем привет!

А мы тут запускаем очередной поток курса «Разработчик JavaScript» и, по рекомендации преподавателей, готовим интересные материалы для чтения. Сегодня посмотрим на одну интересную заметку о визуализации вывода данных.

Поехали.

Круговая диаграмма — самый ужасный способ передачи информации, когда-либо изобретенный за всю историю визуализации данных.

Конечно, существуют и более неудобные методы. Но ни один из них не обладает популярностью и доверием в той же степени, что и круговая диаграмма.

Давайте, я объясню, что с ней не так, и почему вам необходимо перестать использовать ее как можно скорее.

Сперва, поговорим о том, зачем мы вообще используем диаграммы:

  • Диаграммы — способ взять некую информацию и сделать ее более понятной.
  • В целом, задача диаграмм — упростить сравнение разных сетов данных.
  • Чем больше информации диаграмма способна передать без увеличения сложности, тем лучше.


Я покажу, как круговая диаграмма терпит неудачу по всем эти критериям. «Задача» круговой диаграммы — показать взаимоотношения частей и целого.

-ra910ng5jnp1cea2cboetmey8g.png

Посмотрим, насколько плохо она справляется с единственной задачей, для которой она якобы создана. Посмотрите на эти три круговые диаграммы. Предположим, они отражают распределение голосов на местных выборах между пятью кандидатами в трех разных интервалах наблюдения A, B и C:

2bf2_jz0-xfhhuou3ki1em_ee24.jpeg
Открытый источник/ Wikipedia

Итак, что мы можем извлечь из этой информации? Поскольку эти доли голосов, которые получил каждый из кандидатов, читателю должно быть легко понять, что происходит в гонке. Но это не так. Показывает ли кандидат 5 лучшие результаты, чем кандидат 3? Кто показал лучший результат за время A и B — кандидат 2 или кандидат 4? У кого в гонке наибольший моментум?
Так если задача — сделать информацию проще для понимания, насколько вам помогли эти диаграммы? Действительно, если бы я просто дал вам таблицу со значениями голосов, не было бы это проще для восприятия информации?

Но пока посмотрим на ту же самую информацию, представленную в виде гистограммы:

dw-lugxrflvkxi7kcsum-hz6jwm.jpeg

Теперь гораздо понятнее. Мы с первого взгляда можем понять, что именно происходит с каждым из кандидатов в каждый промежуток времени гонки. Эта гистограмма гораздо четче выделяет части целого, чем круговая диаграмма, несмотря на то что это ее основная задача.

Посмотрим теперь на другой недостаток круговой диаграммы, который связан с тем, что люди на самом деле не понимают круги.

Ниже изображена круговая диаграмма с распределением партий Европейского парламента:

q4o3da3y_x-aeof7q38lgo15sfg.jpeg

Основной вопрос — можем ли мы сравнить доли, чтобы выявить различия размеров всех частей диаграммы? Если единственное, что мы пытаемся узнать, что EPP больше, чем S&D, то какой смысл в диаграмме? Я мог бы понять это, просто посмотрев на два числа. Нет, диаграмма полезна только в том случае, если мы можем сравнить все ее элементы друг с другом.
Ниже представлены отдельные доли, для сравнения вырванные из контекста. Посмотрите на них, и подумайте, можете ли вы расставить их по порядку от наибольшего к наименьшему.

bqtmrqye1lvzhkkapc-hsz_f5km.jpeg

Люди вообще плохо умеют сравнивать доли круга, когда речь идет о размере.
Именно поэтому вы могли считать тригонометрию и радианы гораздо сложнее обычной геометрии прямоугольников.

Это не плохо, но такое стоит иметь в виду, когда пытаетесь сформулировать информацию наиболее исчерпывающим и доступным способом. Вот те же данные, но в виде столбчатой диаграммы:

tupicbnessnn59pjktyhxz_wlgk.jpeg

Обратите внимание, что вы можете сравнить каждую партию с любой другой партией.
Просто сравнивните длины прямоугольников, чтобы понять, что происходит.
При большом желании, вы могли бы заменить левую ось на проценты, чтобы узнать распределения внутри парламента. Сейчас же вы можете посмотреть, сколько мест отведено каждой из партий — такой информации изначально не было представлено на круговой диаграмме.

А теперь, посмотрим, как легко можно манипулировать круговыми диаграммами.
Вот те же самые данные, что и выше, но теперь в виде 3D Круговой Диаграммы:

xt_enugiqctmhp7kypkab5pmium.jpeg

Люди постоянно этим пользуются, потому что трехмерная круговая диаграмма, расположенная под углом — отличный способ обмануть вас. Взгляните на диаграмму, S&D — красная партия — выглядит примерно равной партии EPP сине-зеленого цвета. Но такое впечатление создается лишь потому, что я исказил перспективу, создав впечатление, что красный большой.
Это настолько просто, что даже немного стыдно, что Excel позволяет делать такое.
Ниже представлен еще один пример недостатка круговой диаграммы. На самом деле, 10% мужчин, читающих эту статью, даже не поймут, о чем идет речь.

mmr6xku0hiwyrn4uqgrofqpo7o4.jpeg
Красно-зеленый дальтонизм у мужчин

Самые элегантные диаграммы не требуют маркировки данных. Чтобы донести мысль, посторонние числа не требуются. А если требуются, вы используете не ту диаграмму.

Итак, сделаем выводы:

  • Если в представленной информации есть доли схожих размеров, круговая диаграмма — неподходящий выбор.
  • Если результатов наблюдений несколько (3 и более), круговая диаграмма — неподходящий выбор.
  • Круговой диаграммой можно с легкостью злоупотреблять.
  • Круговая диаграмма — неподходящий выбор, если вам нужно маркировать каждый процент.


Перед тем как перейти к финальной критике круговых диаграмм, посмотрим, в чем же они все-таки хороши. Единственная ситуация, в которой круговые диаграммы хороши — сравнение 2–3 результатов наблюдений с очень различающимся количеством информации.

rfsm9jmzk1zeixzxliu0d1igzf8.jpeg
Business Insider, данные из Детройта
Оплаченные и неоплаченные налоги на недвижимость в Детройте, 2011

И все.

То есть, если подумать, единственное, в чем они хороши, единственный способ использования — показать людям, как выглядят доли. Единственная задача диаграммы выше — показать, как выглядит 32 из 100.

На прошлой неделе я прокомментировал, что круговая диаграмма — это Nickelback от мира визуализации данных. Этот выпад широко распространился. Но я пришел к выводу, что есть даже более подходящая метафора. Круговые диаграммы — Аквамен от мира визуализации данных.

Аквамен хорош только в одном. Даже так, другие супергерои DC зачастую могут выполнить работу Аквамена лучше, чем он сам. Супермен задержит дыхание под водой, у Бэтмена просто есть подлодка. Если будет тонуть нефтяной танкер, кого вы позовете? Аквамена? Или Супермена? Начинаешь задумываться, зачем вообще пригласили Аквамена.

orp421ykok2ihzgrawc9wjwm5mi.png

И когда появляется настоящий шанс для Аквамена или круговой диаграммы принести пользу — может вам нужно поговорить с рыбой или объяснить, как выглядит 32% в круге — возникает сомнение, а нужно ли это вовсе. Просто перестаньте использовать круговые диаграммы. Они бесполезны, с ними легко облажаться, и они не справляются с единственной задачей диаграмм — сделать информацию визуально наглядной. Круговые диаграммы — это Аквамен.

Так что же использовать?

Как твитнул Edward Tufte, дата-сайентист, который подробно писал о неудаче круговой диаграммы:

Пользователи круговых диаграмм заслуживают того же подозрения+скептицизма, что люди, которые путают тся/ться. Для сравнения используйте маленькие таблицы, предложения, но не круговые диаграммы. Edward Tufte (@EdwardTufte)

Как всегда ждём вопросы и комментарии тут или можно зайти на день открытых дверей к Александру.

© Habrahabr.ru