В поисках золотого сечения:
разбор инфографики о криминале в вузах Лиги плюща

29.07.2020
Лига плюща - ассоциация восьми старейших частных американских университетов. Студенты Лиги - элита высшего образования США. И если с престижем все понятно, то как обстоят дела с безопасностью? Авторы одного из датавизов категории "Greatest" Tableau решили найти ответ на этот вопрос, а мы решили исследовать их инфографику.

Отправляемся на поиски

Золотое сечение - термин изначально математический. Но искусство, архитектура и дизайн без этой математики немыслимы. К золотым пропорциям стремятся все - как к совершенству, прекрасному и недостижимому. Визуализируя данные, мы тоже каждый раз бросаем себе вызов и ищем свое золотое сечение. Как суметь оживить цифры и сухие логические выводы? Как заставить их рассказать увлекательную историю, не утратив при этом ее смысла?

В поисках ответов на эти вопросы мы отправились исследовать лучшие образцы современного датавиза в категории "Greatest" в галерее работ Tableau Public. Внимание привлекла работа "How Safe Are Ivy League Schools?" Авторы задались нестандартным вопросом: насколько безопасно учиться в вузах Лиги плюща? Для ответа они использовали открытые данные сайта Министерства образования США за период 2001-2014 г.г.

Макет отчета

Меня порадовало с первого взгляда, что инфографика выполнена в идеологии дашборда, на одном экране без скролла. Выделены 3 вертикальных логических блока:

  • по административным нарушениям,
  • по административным взысканиям,
  • по уголовным преступлениям

Вертикальные блоки сверху объединены горизонтальной полосой: 8 логотипов + краткие названия университетов. Это позволяет на визуальном уровне (вне текста) наглядно показать объекты исследования. Логотипы работают и как фильтры: нажав, можно выбрать нужный университет и смотреть информацию только по нему.
Под логотипами расположен слайсер по годам - можно выбрать интересующий период и графики перестроятся. Для визуализации используются традиционные и понятные визуальные решения:

  • гистограмма,
  • фильтр с выбором из выпадающего списка,
  • тепловая карта,
  • диаграмма области.

Шрифты и цветовая гамма

Авторы очень грамотно используют шрифты: для заголовков выбраны 2 броских bold-шрифта, для описания и цифр – лаконичный, хорошо читаемый шрифт без засечек.

Цветовая гамма – гармоничное сочетание молочно-кремового и зеленого (возможно, как отсылка к цвету листьев плюща). Но… в этом месте наш внутренний Аналитик вдруг подал голос. Оказалось, тот самый умиротворяющий зеленый, который так восхищенно рассматривал Дизайнер, очень смутил нашего Аналитика.

Зеленый интуитивно воспринимается как положительный - чем зеленее, тем лучше. А значит, насыщенный зеленый цвет должен говорить о низком уровне опасности.

Но у визуализаций по тепловой карте собственная цветовая логика - и это приводит к конфликту цвета и данных. Например, данные по Cornell University по факту распределились так:

  • 100-200 правонарушений – стандартный зеленый цвет,
  • 200-500 правонарушений – светло-зеленый цвет,
  • свыше 500 правонарушений – темно-зеленый цвет.
Что могло бы помочь Аналитику чувствовать себя более комфортно? Как вариант, добавление в отчет альтернативного цвета красного спектра для создания перехода между негативом и позитивом. И такой цвет, как выясняется, есть. У Лиги плюща несколько фирменных цветов и один из них - Harvard crimson - как раз нужного "багрового" оттенка.

Визуализации: Аналитик в смятении

Для визуализаций были выбраны простые и интуитивно понятные графики. Авторам блестяще удалось показать большой объем данных без дробления и визуального утяжеления – настоящее «золотое сечение»! Существенную роль сыграли всплывающие подсказки - их много и они достаточно информативны.

Но неоднозначная логика в выборе измерителя перечеркивает для нашего Аналитика всю легкость визуального решения. В качестве единицы измерения авторы выбрали абсолютные величины: количество правонарушений или преступлений. Для таких исследований абсолютные величины, на наш взгляд, не вполне информативны.

Например, в 2014 году в Cornell University насчитывается 691 Disciplinary Actions (дисциплинарных взысканий). Это много или мало? Вроде бы, много. В том же году в Dartmouth College их было всего 386. Похоже, в Cornell University дела плохи? Тем более, что и текущая логика тепловой карты говорит об этом:
Но выводы могут быть неверны. Для понимания реальной ситуации мы бы рекомендовали дополнительно учесть данные об общем количестве студентов. Эти данные в инфографике есть. При наведении на гистограммы (левый визуальный блок) всплывают подсказки с цифрами по каждому университету.

Итак, 691 дисциплинарное взыскание в Cornell University при 21 679 студентах и 386 взысканий в Dartmouth College при 6 298 студентах. Получается 31,9 взыскания на 1000 студентов в Cornell University и 61,3 взыскания на 1000 студентов в Dartmouth College – с убедительным преимуществом выигрывает… Cornell University!

Вероятно, сами авторы также ощутили неоднозначность логики отчета и даже пытались как-то ее компенсировать. Так, на гистограммах количество студентов показывается толщиной столбца. Но для нашего педанта Аналитика такой график выглядит трудночитаемым и он ворчит, что приходится прикладывать лишние усилия, чтобы в нем разобраться:
Нам также не хватило цветовых легенд - хотя бы по одной на каждый блок. Напоследок Аналитик пробурчал еще что-то о горизонтальной шкале для тепловых карт – ведь только из подсказок он смог понять, что здесь собраны сводные данные по годам для каждого из университетов.

Критикуешь - предлагай!

Этот отчет заслуженно входит в категорию "Greatest" в Tableau - авторы поставили перед собой сложную и объемную задачу, эффектно ее реализовав. Если бы не упомянутые замечания к логике измерения и цветовым решениям, отчет был бы почти безупречен с точки зрения пользователя.

В то же время нам не хватило ответа на исходный вопрос: так насколько же безопасно учиться в Лиге плюща? Чтобы попробовать найти ответ, наш Аналитик предложил добавить в отчет сводные индикаторы безопасности для всей Лиги плюща, а также представить данные в виде количества тех или иных событий на 1000 студентов. Наш Дизайнер с энтузиазмом всё это реализовал. Итогом их совместного поиска золотого сечения стала вот такая визуализация:
Итак, что мы видим? Среди всех видов Law Violations (нарушения закона) лидирует Liquor Law Violations (нарушения, связанные с употреблением алкоголя) - каждые 8 из 1000 студентов Лиги подверглись Disciplinary Actions и Arrests (дисциплинарным взысканиям и арестам) за эти правонарушения. Среди Criminal Offenses (уголовные преступления) печальное лидерство у Burglary и Robbery (кражи со взломом и ограбления) - их совершают каждые 4,6 из 1000 учащихся Лиги плюща.

Уже упоминавшийся Dartmouth College и примкнувшие к нему Princeton University и Brown University - самые "красные" участники нашей таблицы. Увы, эти заведения превысили почти все сводные средние показатели - как по Law Violations, так и по Criminal Offenses.

А вот Columbia University in the City of New York, Cornell University, Harvard University и University of Pennsylvania находятся преимущественно в безопасной "зеленой" зоне, а если и превышают средние показатели по Лиге, то ненамного.

Правда, Harvard University оказался неожиданным лидером по кражам со взломом и ограблениям - с показателем 9,1 против среднего 4,6 в целом по Лиге. Но если рассмотреть внимательно сводную тепловую карту по Criminal Offenses 2001-2014, становится ясно, что эти проблемы у Harvard University в прошлом - начиная с 2009 года университет перешел в команду "зеленых" игроков, и больше ее не покидал.

Выводы

Современные данные недаром называются Big Data - чем больше данных, тем сложнее их визуализировать. Объемным данным нужна детализации, а это влияет на визуальную часть анализа. Исследуемый отчет успешно избежал проблем с визуализацией - авторы нашли конструктивное графическое решение для массивного блока данных. Но полнота данных заместила собой, собственно, сам анализ.

Не претендуя на истину и вооружившись бритвой Оккама (да-да, у аналитиков в арсенале много всяких приемов), мы сгруппировали данные по преступлениям в категории Criminal Offenses и избавились от детализации санкций по Law Violations. Это позволило рассчитать сводные индикаторы безопасности, провести сравнение университетов Лиги плюща и найти для себя какие-то ответы. Возможно, получилось не так элегантно, как в исходном варианте. И здесь есть уже над чем задуматься нашему Дизайнеру.

Наш совет - работая над визуализацией данных, переключайтесь внутри с Аналитика на Дизайнера и обратно. И не забывайте подключать Пользователя, ведь именно он будет оценивать конечный результат.
Читайте также