Карьерный рост аналитика. Статья Алексея Колоколова

Диаграммы — что это такое: какие виды графиков бывают на дашбордах

Если раньше для визуализации корпоративных данных компании нанимали дизайнеров и инфограферов, то теперь эти навыки нужны специалистам разных отраслей и направлений. И чаще всего на первых порах все совершают одну и ту же ошибку — выбирают не те визуализации, которые помогают анализу данных и быстро доносят их смысл. В этой статье вы узнаете, какие основные диаграммы бывают и в чем их назначение, а также увидите примеры, которые помогут правильно выбирать способ представления данных в виде графиков.

Немного истории

С помощью визуализации можно представить даже самую сложную информацию понятно и наглядно. Ее активно используют в разных сферах, в том числе и в бизнесе. Но были случаи, в которых это помогло спасти множество жизней.

Еще в 19 веке врач Джон Сноу отметил смертельные случаи заболевания холерой на карте Лондона. И именно это помогло найти источник заражения. Еще один знаменитый пример — история медицинской сестры Флоренс Найтингел. С помощью круговой диаграммы она показала руководству армии, что большинство солдат умирает не на полях сражений, а от болезней. После этого начались реформы в области здравоохранения.

Что такое средства визуализации

Большое количество цифр воспринимать сложно. Особенно когда их нужно сравнить между собой, чтобы сделать выводы. В таких случаях на помощь приходят диаграммы — линии или геометрические фигуры, которые выстраиваются на основе данных и обозначают соотношение величин. Эти графические элементы помогают оперативно воспринять информацию и прийти к нужным выводам.

Наглядное изображение позволяет быстро уловить суть, увидеть закономерности и структуру показателей, что почти невозможно сделать с помощью табличных данных.

Как показать информацию: виды графиков

Главное правило — у каждого визуального элемента есть свое назначение. Выбирать его нужно не «для красоты», а для точного отображения смысла данных. Только в таком случае это действительно поможет и правильному восприятию, и корректным выводам.
Решение задач бизнеса с помощью аналитики
Кейсы и лайфхаки от практика
Excel, Power BI, PowerPoint

Обучение на реальных бизнес-задачах

Курсы по визуализации и аналитике данных
Рассмотрим подробнее виды диаграмм с примерами, а также разберемся, какую практическую пользу можно извлечь благодаря визуализации.

Столбчатая диаграмма

По-английски она называется bar chart. По сути, это график из столбцов, расположенных вертикально или горизонтально.

Такой элемент разумно использовать при ответе на вопрос «Сколько?» для различных категорий, чтобы сравнить их между собой. Например, увидеть картину продаж по филиалам магазинов и городам (без значимости их расположения на карте), по видам товаров, по каналам продаж, по менеджерам и так далее.
Продажи
Высота (или длина) столбцов прямо пропорциональна величине отображаемой категории. Другими словами, чем больше прямоугольник, тем крупнее показатель.

Чтобы соотношение столбцов воспринимали правильно, ось с категориями данных следует начинать с нуля. На картинке ниже приведен неправильный пример: так делать нельзя, потому что разница между продажами в Краснодаре и в Сочи будет выглядеть больше, чем есть на самом деле. Ошибки в визуализации влекут за собой искажение данных, а значит, пользователь может сделать неправильный вывод.
Пример
Гистограмма
Это диаграмма с вертикальным расположением столбцов, на английском — bar histogram. Ее тоже используют для сравнения категорий, а еще для мониторинга распределения данных. Например, если нам нужно оценить равномерность звонков в колл-центре, изучив их количество по часам, или возрастной состав целевой аудитории, посчитав число человек в различных возрастных группах, следует строить гистограмму.

В качестве примера рассмотрим график распределения заказов доставки суши по дням недели.
Заказы
По оси X откладываем дни недели, а по оси Y — количество заказов. Проанализировав гистограмму, делаем вывод, что в пятницу, субботу и воскресенье заказов гораздо больше, чем в будни, а в среду и четверг их мало. Эта информация поможет спланировать объем закупки продуктов и количество курьеров.
Линейчатая
Если необходимо сравнить более 10 категорий или их названия очень длинные, разумно использовать визуальный элемент, что называется линейчатой диаграммой. Если на гистограмме столбцы вертикальные, то здесь они располагаются по горизонтали. Преимущество в том, что для подписей категорий остается больше места, поэтому они считаются удачным вариантом для длинных названий.
ФИО
По оси Y откладываются сравниваемые категории (менеджеры), а по оси X на шкале измерения — количество заказов. Таким образом, длина полосы пропорциональна величине показателя, а ее ширина должна быть одинаковой для всех категорий.

Линейный график

По-английски это line chart. Представляет собой визуальный элемент в форме линии и относится к числу тех, какие виды диаграммы вам известны. Например, мы могли видеть его во время изучения прогноза погоды или в результатах ЭКГ.

Их используют, когда нужно визуализировать динамику количественных показателей за конкретный период (несколько дней, месяцев, кварталов, лет). Они помогают акцентировать внимание на изменениях во времени, увидеть тренды и сезонность. На изображении ниже видно, что в первом квартале каждого года количество заказов падает и затем возрастает.
Время
По оси X всегда идет временная шкала, в данном случае это кварталы. По вертикальной оси откладываем значения показателя – количество заказов. Затем соединяем точки. Горизонтали минимума и среднего выполняют вспомогательную для анализа роль и не являются обязательными к построению.
Линейный график с несколькими рядами данных
По сути это то же самое, только с несколькими линиями. Его мы используем, если нужно увидеть, как изменялся показатель во времени для разных категорий. Английское название этого элемента — line chart with multi-axis.

Например, он подходит для визуализации динамики количества заключенных договоров по менеджерам в течение года или изменения продаж в разных филиалах за 4 года, как на примере ниже.
Города
Линейный график с несколькими рядами данных передает динамику и соотношение разных показателей в общей точке во времени. Таким образом, можно оценить не только улучшение или ухудшение процесса, но и сравнить их между собой. Для этого показатели обозначаются отдельными линиями в различном цвете. Лучше всего использовать контрастные цвета и ограничиться 5 категориями.
Интерактив на базе сводных таблиц в Excel
Грамотная визуализация любых данных
Наглядные отчеты для вашего руководства

Интерактивные отчеты, которые понравятся директору

Бизнес-дашборды в Excel
ОНЛАЙН-КУРС

Круговая диаграмма

Это график в форме круга, разделенного на секторы. Визуально напоминает пирог, поэтому известен также как пай-чарт (от английского pie chart). Помогает оценить, какую часть от целого составляет отдельная категория. Используют его для сравнения групп, например, для ответа на вопрос, какую долю в продажах занял тот или иной продуктовый сегмент.
Проценты
Круг — весь объем данных, а сектор — доля этого целого. В приведенном примере графическая диаграмма наглядно показывает, что оборудование — это самый существенный сегмент в продажах. Его доля составила более 60 процентов от общей суммы.

При построении пай-чарта рекомендуется:

● сортировать сектора по убыванию, от большего к меньшему;
● использовать проценты, а не абсолютные значения, и убедиться, что сумма частей равна 100%;
● выделить категории различным цветом, проверив их контрастность для печати в черно-белом формате и для пользования людьми с нарушением цветового восприятия;
● заменить легенду на подписи категорий, чтобы не переключать внимание пользователя между графиком и цветовым обозначением;
● использовать этот тип визуализации не более чем для 5 категорий, чтобы не перегрузить состав диаграммы.
Кольцевая
Она тоже нужна, чтобы показать структуру, то есть части целого. На английском языке этот визуальный элемент называется donut chart, то есть «пончик» или «бублик». Происхождение таких названий легко объяснимо, потому что по форме это круг с выемкой посередине.
Сегменты

Диаграмма с областями

Еще ее называют площадной, а на английском – area chart. Представляет собой линейный график с закрашенной областью под ним. Отображает динамику изменения количественного показателя во времени. Помогает ответить на такие вопросы:

● какими были продажи в течение нескольких лет и есть ли сезонность;
● как менялись расходы помесячно;
● какова динамика складских остатков в течение квартала.

На картинке ниже — пример того, как выглядит графическая диаграмма с областями с сайта Microsoft.
Разница
Здесь показано сравнение продаж текущего года (красный цвет) с прошлым (синяя область) в динамике с января по август. Видно, что в этом марте, мае и июне результаты были успешнее, чем раньше, но в других месяцах ситуация обстоит хуже.

Чтобы закрашенные области не перекрывали друг друга, отрегулируйте прозрачность цвета специальной настройкой «transparency» или снизьте яркость. Если вы используете excel и таких опций нет, выберите другой элемент визуализации, например, простой линейный график. На картинке ниже представлен пример, когда прозрачность не добавлена, поэтому мы не видим динамику изменения показателя на втором плане.
Сравнение

Комбинированная диаграмма

Combined diagram объединяет в себе несколько стандартных визуальных элементов (обычно два). Может быть составленной из разных видов графиков, например, как на картинке ниже.
Различия
Такая комбинация содержит динамику изменения выручки и прибыли по кварталам. Эту же визуализацию можно скомбинировать из двух линейных графиков, как на следующей картинке.
Динамика

Диаграмма рассеяния

Используется, чтобы визуально определить, есть ли зависимость между двумя разными параметрами, например, между температурой воздуха и продажами мороженого. Ее еще называют точечной, по-английски – scatterplot. По осям отмечаются значения показателей, а точками обозначаются события (факты).

Пример можно увидеть на Tableau Public — в галерее дашбордов, сделанных в одной из самых популярных BI-систем.
Точки
На визуализации отображена взаимосвязь ранних родов с 15 до 19 лет и уровня образования по штатам США. Рассмотрим подробнее, что представляет собой диаграмма.

По горизонтальной оси откладываем долю населения со степенью бакалавра в процентах, по вертикальной — количество ранних родов на 1000 человек. Точки символизируют штаты со значениями показателей на пересечении. Цвет добавлен для более наглядного представления уровня просвещенности населения. Коричневый — для штатов с низкой долей жителей, имеющих законченное образование, зеленый – для регионов с большим количеством таких граждан. Наклонная вспомогательная линия подчеркивает вывод, что при повышении общего уровня образованности количество ранних родов в возрасте от 15 до 19 лет снижается.

Рассмотрим пример, приближенный к бизнес-задачам. Если мы хотим узнать, есть ли взаимосвязь между выручкой и прибылью, то по горизонтальной оси отложим значения выручки, по вертикальной – прибыль. Точки при этом будут символизировать сделки: каждая обозначает одну продажу. Вот как будет выглядеть такая диаграмма рассеяния:
Прибыль
В данном случае взаимосвязь показателей слабее, чем в первом примере, так как разброс точек шире. Однако можно осторожно предположить, что чем больше выручка, тем выше прибыль. Легко обнаружить выбросы – измерения, выбивающиеся из общей тенденции. На скаттерплоте это точки, которые находятся на большом расстоянии от основного облака. Такими событиями могут быть крупная покупка, внушительный расход или просто ошибка в данных.

Ниже рассмотрены два принципиально разных выброса. В обоих случаях была получена аномально большая выручка, но в первом бизнес понес убыток, а во втором получил крупную прибыль.
Подобные находки в данных имеют большую пользу для бизнеса, для чего и используются современные диаграммы.
Чтобы углубить анализ, для детализации по дополнительным категориям можно добавить цвет. На следующей визуализации точки раскрашены в зависимости от сегмента бизнеса.
Взаимосвязь
Таким образом, можно сделать вывод, что самый нестабильный финансовый результат приносят продажи техники: есть и суперубыточные, и суперприбыльные сделки.
Профессиональное владение Power BI
Интерактивные отчеты за 3 часа
Быстрый и удобный анализ данных

Красивые и понятные аналитические отчеты за 1 месяц

Дашборд в Power BI с нуля до профи
ОНЛАЙН-КУРС

Пузырьковая диаграмма

Иногда в скаттерплот добавляют еще одну переменную, величина которой различается размером символа. В таком случае мы получаем пузырьковую диаграмму, по-английски – bubble chart. Используйте ее, если необходимо проанализировать больше двух показателей, а также выявить отклонения и закономерности в распределении элементов.

Поговорим про пузырьковые диаграммы и разберемся, что это такое на примере. Рассмотрим визуализацию из предыдущего раздела, но с добавлением показателя в виде размера скидки.
Результат
По осям координат располагаются основные переменные – выручка и прибыль, величина дисконта обозначается размером «пузыря»: чем больше скидка, тем он крупнее. На примере видно: прибыль обеспечивают в основном продажи без скидок, а убыток приносят сделки с большим дисконтом. Это значит, что компании нужно срочно пересмотреть свою скидочную программу.

Географическая карта

Говоря о том, какие виды графиков и диаграмм существуют, нужно упомянуть и map chart. В течение жизни с картой встречались все, поэтому визуализацию будет несложно понять.

Чтобы добавить смысла абстрактным цифрам и поместить их в географический контекст, категории (магазины, города и так далее) наносят на карту в соответствии с местоположением объекта. Величину показателя обычно кодируют цветом: чаще всего насыщенностью, или размером шарика, если объединяют карту с пузырьковой диаграммой.

Пример картограммы с сайта «Россия в данных» показывает, что цвет региона зависит от того, как изменилась численность населения в процентах.
Карта

«Солнечные лучи»

Не все названия вспоминаются сразу при ответе на вопрос, какие виды диаграмм вы знаете. Одним из таких случаев является лучевая, по-английски – sunburst chart. Она встречается нечасто, однако прекрасно подходит для визуализации иерархических данных. Эта диаграмма под названием «солнечные лучи» показывает, как группа разбивается на составляющие ее подгруппы. С одним уровнем иерархии она была бы похожа на кольцевую.
Жанры
На картинке представлена структура контента стримингового сервиса Netflix с детализацией до конкретного фильма (M – movie) или сериала (S – series). Жанры обозначены различным цветом, что наглядно акцентирует преобладание драм (Drama) и научной фантастики (Scify/Fantasy) в общем количестве из 29 названий. Внешний круг символизирует общую продолжительность подборки в 41 час и разбит на сектора по длительности произведений.

«Полярные часы»

По-английски этот визуальный элемент называется polar clock, и это еще один необычный способ представления данных. График воплощает принцип часов и визуально повторяет циферблат.
Деятельность
На примере изображено, как по воображаемой временной шкале откладывается продолжительность занятий. В соответствии с цветовой легендой, время в соцсетях равно рабочему и меньше, чем спортивные занятия. Диаграмма эффективна тем, что график очень наглядно это показывает. Тем же способом можно визуализировать, например, продолжительность проектов или длительность выполнения заявок.

Однако «полярные часы» используют редко, так как данные трудно считывать правильно. Из-за округлой формы и наличия нескольких уровней ближайшие к центру полосы кажутся меньше, чем расположенные на внешнем уровне, хотя по шкале времени они равны. К примеру, на приведенной картинке красная полоса визуально кажется короче синей, хотя она длиннее и переходит отметку стрелки в 6 часов.

Потоковый график

Это разновидность диаграммы с областями и накоплением, по-английски — stream graph. Его тоже используют, когда нужно оценить одновременно динамику изменения показателя во времени и структуру данных. Отличием является то, что значения откладываются не вдоль оси X, а распределяются относительно центральной линии отсчета.

Своим названием такие элементы обязаны внешнему сходству с течением реки из-за плавных форм. Подходят при трейдинговом и финансовом анализе для визуализации изменения стоимости акций, ценных бумаг или валют за определенный период времени. В качестве примера приведена визуализация с портала Tableau Public.
Корпорации
Потоковый график отображает цены закрытия акций компаний Apple, Facebook, Google и Amazon по месяцам за 10 лет. Закрашенная своим цветом область показывает стоимость акций, поэтому компании легко сравнить между собой.

Диаграмма «Спагетти»

Отображает движение людей, материалов или информации в виде линий. По-английски называется spaghetti chart. Часто используется в метеорологии для визуализации воздушных потоков, как в примере — это помогает синоптикам строить погодные прогнозы.
Картограмма
Такую визуализацию также применяют при описании процессов на производстве.
Схема
На картинке слева описано, как материалы двигались по фабрике изначально, а справа – после оптимизации. Высвечивая возможные потери на перемещения, «спагетти» является неотъемлемым инструментом при внедрении принципов бережливого производства и «6 сигма».

Как показать данные понятно: несколько правил

Визуально представленная информация воспринимается быстрее по сравнению с текстовой или табличной формой. Однако неграмотная подача влечет за собой ошибки в восприятии. Чтобы визуализации были считаны без искажений, при построении руководствуйтесь несколькими принципами.

1. Используйте элемент, который соответствует цели и подходит для вашего вида анализа. Например, чтобы продемонстрировать изменение показателя со временем, возьмите линейный график. Если же нужно увидеть лучшие и худшие результаты, то есть провести количественное сравнение, выберите вертикальный или горизонтальный барчарт.

2. Соблюдайте общепринятые нормы. Например, временные интервалы указывайте в хронологическом порядке слева направо. Если вы визуализируете категории, которые вызывают распространенные ассоциации (мужчина - синий или голубой, женщина - розовый), используйте привычные цвета. Для этого необходимо понимать, что показывает диаграмма.

3. Упростите дизайн, чтобы не отвлекать внимание от данных. Уберите яркую координатную сетку, тени, градиентную заливку, трехмерные эффекты. Используйте палитру из совместимых между собой цветов.

4. Отсортируйте и упорядочьте данные, расположите тексты горизонтально.

5. В больших числах разделяйте разряды и не используйте цифры после запятой, если это не критично.

Чтобы вы могли научиться грамотному форматированию визуальных элементов в Power BI, рекомендуем урок на YouTube.

Подведем итог

Мы рассмотрели, какие существуют основные типы, назначение и примеры графиков и диаграмм. Вот несколько наиболее популярных.

● Показать изменение во времени — линейный график.
● Визуализировать состав целого — пай-чарт.
● Сравнить категории — столбиковая диаграмма.
● Отобразить взаимосвязь показателей — точечный график.

Кроме того, рассмотрены такие неординарные визуальные элементы, как «солнечные лучи», «спагетти» и «полярные часы».

Помимо описанных, бывают и такие виды визуализаций, как тепловая карта, treemap и sankey, роза ветров, воронка, ящик с усами, спидометр и др. Они применяются для решения специфических задач.

Знать, какие бывают типы диаграмм и графиков, и уметь верно выбрать его в соответствии с задачей анализа – это базовая компетенция для человека, работающего с информацией. Чтобы стать экспертом, необходимо изучить много материалов, тем не менее, первый шаг уже сделан.
Вам понравилась статья?
Читайте также
Подпишись на рассылку и получи в подарок «Каталог лучших отраслевых дашбордов»!

Хочешь получать актуальные статьи о визуализации данных?