Data analysis and chart types: How to choose visualization

Among the huge number of types of diagrams, only 5 of them are used most often in management reports. And even in them novice analysts make the same mistakes. As a result, they get a write-up from the managers: they spent time, but the report in the end is still incomprehensible.
Charts are not needed to make the report beautiful (although this is important). The main task of visualization is to clearly display the meaning of the data.
• Data analysis basic types
• 5 types of standard charts
• Chart Selection Matrix
• Charts with columns for rating
• Graph or histogram: how to show dynamics
• The pie chart has only one goal
• When to use the bubble chart
• Where to learn competent data visualization
Here is a cheat sheet that will help you use standard charts correctly in data visualization.

The type of data analysis is the basis for choosing a chart

The first thing to do before choosing a visualization is to understand what exactly we want to show. And what kind of data analysis will we use.

There are 4 basic types of analysis. To visualize each of them, you can use only certain types of diagrams: the rest will distort the perception of the data and simply will not help you see what you need.
Basic types of data analysis
Rating — we use this type of analysis when we need to compare several indicators with each other. For example, to understand which store brings more profit, which of the managers has concluded more deals, for which item the company has the biggest expenses (well, or the smallest). That is, it is any quantitative comparison on a scale, a gradation from more to less.

Dynamics is the type of analysis we choose when we need to track the change in one indicator. For example, to determine the seasonality for our product, to see how the sales volume changes: when there are peaks, and when there are falls.

Structure — used in cases when it is important for us to divide something into fractions and show the volume of each. For example, if you need to segment the customer base, product groups, or evaluate the structure of the client portfolio. Absolute values here fade into the background, in the first place — it is the fractions.

Relationships — this type of analysis is rarely used in management reporting, but sometimes it happens if you need to establish a relationship between several variables. For example, compare the sales rate with the dollar exchange rate or determine the nature of the relationship between revenue and the quantity of goods.

Basic types of diagrams

Only certain visualizations can be used for each type of data analysis. There are 5 basic and most popular types of charts.

1. Bar chart. This is a chart with horizontal columns.

2. Histogram. This is a chart with vertical columns.

In English, both charts with columns are called velvet, which can be either horizontal or vertical. We are used to different names, besides they are also used in MS Office products.

3. Schedule. It looks like a line with intermediate data points on it.

4. Pie chart. A solid circle divided into sectors. It is also called a "pie" or pie chart. A special case of such visualization is a ring diagram resembling a donut in shape.

5. Bubble chart. The English name is Bubble Chart: the size of the bubbles here serves as an additional dimension of the data. This is a kind of scatter plot, which is also called a scatter plot or scatter plot.
Chart Selection Matrix

Which chart should I choose for each type of analysis? To make it easier to navigate, I will show you a special matrix. On the left — the basic types of data analysis, on the right — the types of diagrams suitable for each of them.
Матрица выбора стандартных диаграмм
Selection matrix standard diagrams
For example, here you can see that a pie chart can only be used to visualize the structure: it is not suitable for any other type of analysis. The same goes for the rest of the basic visualizations.
This matrix is based on Gene Zelazny's book "Speak the Language of Diagrams". I adapted it for the Russian-speaking user and simplified the terms a little.

Ruler and histogram — for rating

Both a bar chart and a histogram can be used to visualize the rating. But they are not always interchangeable. What exactly is better to choose in your case most often determines the number of elements.

If there are many elements, the histogram will make their comparison not only inconvenient, but even impossible. Which means it will be useless. This is clearly seen in the example:
Когда неправильно выбрали гистограмму
Когда неправильно выбрали гистограмму
How much revenue is more or less in one store than in another? Completely incomprehensible. And the addresses of stores under the columns are very difficult to read, because they are located at an angle.
A sure sign is that if the signatures do not fit, then the diagram needs to be turned over. That is, choose a horizontal bar chart. And the same should be done if you have more than 10 data points.
Линейчатая диаграмма — для большого числа точек данных
Линейчатая диаграмма — для большого числа точек данных
Of course, it is necessary to proceed from a specific case. Sometimes, even with a small number of data points, a histogram will not work, for example, because of long column labels. And sometimes at 4 points it will just be unconvincing. Be guided by how much space on the dashboard you are ready to allocate for this visualization: in some cases, a bar chart will show the trend better.
Даже при небольшом числе точек данных гистограмма — не всегда лучший выбор
Когда гистограмма — не лучший выбор
Но! Когда данные необходимо упорядочить по оси X, лучше выбрать вертикальные столбцы, то есть гистограмму. Например, если нужно сегментировать аудиторию по возрастам.
Если данные нужно упорядочить по оси X, выбирайте гистограмму
Если данные нужно упорядочить по оси X, выбирайте гистограмму

Сhart or histogram is for dynamic

Чтобы показать, как меняется переменная, например, во времени, также можно использовать две диаграммы: график в виде линии или вертикальный барчарт (гистограмму). Но что именно выбирать в каждом случае?

Покажу на примере. На картинке ниже — одни и те же данные, визуализированные по-разному. Я показываю этот слайд на своих лекциях и спрашиваю студентов, что выбрали бы они. 80% голосуют за гистограмму.
Тренд можно показать с помощью графика или вертикального барчарта
Тренд можно показать с помощью графика или вертикального барчарта
Предпочтения понятны: на гистограмме четко видно и подпись, и значение. О графике же обычно говорят, что он выглядит оторванным от шкалы и каким-то «пустым». Вызывают сомнения и прямые линии между точками: действительно ли рост или падение были такими равномерными? В общем, такое отображение динамики вызывает недоверие.
Отсюда и вывод, и правило: если точек данных мало, для визуализации динамики лучше использовать гистограмму. Если же их 10 или больше, выбирайте график.
Также график стоит выбирать, если мы используем несколько рядов данных. Например, показываем динамику продаж нашего товара в нескольких городах.

Конечно, для каждого города можно сделать отдельную гистограмму, но тогда место на дашборде мы используем нерационально. Чтобы его сэкономить, все это лучше отобразить на линиях графика. Даже если у нас меньше 10 точек данных. И не забывайте добавлять промежуточные линии сетки!
Если нужно отобразить динамику по нескольким объектам, используем график
Если нужно отобразить динамику по нескольким объектам, используем график
Круговая или кольцевая диаграмма — для структуры

Принципиальной разницы между круговой и кольцевой диаграммами нет. Тот случай, когда можно выбирать то, что нравится больше. Обе они нужны, чтобы показать, из каких частей состоит наше целое и сколько места в этом целом занимает каждая часть.
Круговая и кольцевая диаграммы
Главное, что нужно знать о круговой и кольцевой диаграммах — их можно использовать ТОЛЬКО для визуализации структуры целого. При этом для отображения временных промежутков или этапов отдавайте предпочтение гистограмме.
Любая из этих диаграмм будет понятной только на небольшом объеме данных. Если секторов/долей много, выбирайте другую визуализацию.

Еще несколько мини-правил по оформлению кольцевой и круговой диаграмм:

• сортируйте данные от большего сектора к меньшему;
• отсчет — как с точки «12:00» на циферблате;
• не перегружайте эти диаграммы легендой.

Пояснение по последнему пункту: метание глаз от цветных квадратиков в легенде к секторам диаграммы и сопоставление этих цветов — это барьер для восприятия. А когда человек встречается с визуальным барьером, он теряет суть и не может быстро прийти к нужному выводу.
Круговая диаграмма: не используйте легенду
На круговой диаграмме никогда не должно быть легенды

Точечная и пузырьковая диаграмма — для взаимосвязей

Часто их используют не к месту, просто чтобы «разнообразить визуальный ряд». И вот что нужно знать об этих визуализациях.
Для большинства видов анализа использовать точечную или пузырьковую диаграмму просто нельзя. Исключение только одно: если нужно показать взаимосвязи между несколькими переменными. Не используйте их, если у вас только один количественный показатель.
Не используйте пузырьковую диаграмму, если нет взаимосвязи показателей
Не используйте пузырьковую диаграмму, если взаимосвязи показателей быть не может
Но когда мы хотим увидеть, как связаны разные показатели, эта визуализация будет самым подходящим вариантом. Например, если нужно проследить, в каких городах большой оборот приносит более крупную прибыль, а где при том же обороте прибыль «проседает».
Пузырьковая диаграмма делает взаимосвязь оборота и прибыли наглядной
Пузырьковая диаграмма делает взаимосвязь оборота и прибыли наглядной
На пузырьковой диаграмме мы можем расположить показатели оборота по оси X, а показатели прибыли — по оси Y. И сразу увидим, что больше всего мы зарабатываем в Сургуте, Ханты-Мансийске и Мегионе. Наименее «интересные» города здесь — это Североуральск и Алапаевск, где при большом обороте прибыль остается низкой.

Выбирайте мозгом, а не глазами

Визуальное оформление дашборда важно — я говорю об этом всегда и повторю сейчас. Но выбирать диаграммы нужно по смыслу данных. Только так можно упростить их анализ, сделать их понятными и наглядными. Тем более что это никак не противоречит красивому оформлению.
Эта статья — часть программы моего экспресс-курса «Дашборд в Excel». Первый модуль о базовой визуализации можно пройти бесплатно: там гораздо больше теории, чем в этой статье, и гораздо больше нюансов, которые надо учитывать даже при выборе стандартных диаграмм.
Новые навыки студенты этого курса отрабатывают уже во время обучения: даже на бесплатных уроках есть практические задания. Дальше — работа со сводными таблицами и срезами в Excel, которые нужны интерактивному дашборду. А через 5-7 дней уже можно показать руководству принципиально новые отчеты: красивые, понятные и помогающие сделать полезные для бизнеса выводы.
