Что такое ThoughtSpot и правда ли это — революция в BI? Тестирую

09.06.2021
Последние 5 лет на российском BI-рынке все было стабильно и интеграторы работали с тройкой лидирующих платформ: Tableau, Qlik и Power BI. Но в 2021 году компания Navicon начала внедрять в России новую платформу ThoughtSpot. Это вызвало отраслевой интерес к продукту, все стали обсуждать возможности искусственного интеллекта в нем и даже говорить о революции в BI. С тех пор, как я впервые услышал о ThoughtSpot, мне хотелось протестировать эту платформу. Наконец, такая возможность представилась.
ThoughtSpot в квадранте Гартнера
Компания ThoughtSpot начала работать в 2012 году, а в 2017 она была включена в квадрант Гартнера, где находится и сейчас. В своей работе эту платформу используют Walmart, Rolls Royce, Daimler и другие топовые компании. Уже в 2018 году стоимость ThoughtSpot оценивалась в 1 млрд долларов.
Возможности ThoughtSpot мне демонстрировала Ани Манукян — бизнес-аналитик компании Navicon, которая внедряет эту платформу в российских компаниях. Знакомство с самой Ани, кстати, тоже оказалось интересным, поэтому сначала расскажу немного о ней. Возможно, это будет полезно тем, кто пока не успел отучиться в вузе, но уже присматривается к профессии бизнес-аналитика.
Ани Манукян — бизнес-аналитик Navicon

Бизнес-аналитик по специальности — редкий случай

— Ани, расскажи о себе: как ты пришла к профессии аналитика?
Я закончила вуз по специальности «Бизнес-информатика», так что сразу начала работать по профессии. Это образование определенно принесло пользу, потому что на выходе из вуза я уже имела довольно четкое представление не только о том, как устроен бизнес, но и о том, какие BI и ERP-системы есть на рынке.

Мы проходили и экономику, и менеджмент, изучали 1С, SAP как обычные пользователи и как программисты. Уже во время учебы у нас была возможность попробовать себя в разных ролях и понять, по какую сторону баррикад хочешь оказаться: стать либо тем, кто формулирует требования к бизнес-задачам, либо тем, кто эти бизнес-задачи решает.
— Как давно ты работаешь в Navicon и чем именно занимаешься?
В «Навиконе» я полтора года: пришла на стажировку, когда еще училась на четвертом курсе и искала работу по специальности. Сейчас работаю бизнес-аналитиком на проектах, связанных с Tableau, Power BI и ThoughtSpot. Собираю требования у бизнес-заказчиков и пишу задачи для разработчиков.

Как ThoughtSpot появился в России

— Расскажи, как и почему Navicon решил взять себе в портфель этот продукт?
К нам пришел один из заказчиков и рассказал о нем. Удивлялся, что никто в России не смотрит в эту сторону, хотя это интересно, необычно и точно ново не только для российского, но и для мирового рынка.
«Фишка» ThoughtSpot — в механизме искусственного интеллекта, который мгновенно генерирует графики с данными в ответ на внутренний поисковой запрос. Это помогает бизнес-пользователю быстро получить ответ на свой вопрос, не обращаясь к команде разработчиков. По данным сайта ThoughtSpot, такой подход ускоряет подготовку данных для отчетов на 80% и требует на 60% меньше времени работы бизнес-аналитиков.
Мы решили познакомиться с системой и обратились к вендору. Он легко пошел на сотрудничество, хотя до этого даже не смотрел в сторону российского рынка и рынка СНГ. Работать начали быстро: представители вендора подключались к нашим встречам с заказчиками, отвечали на их вопросы. Так сотрудничество и было налажено.

Сейчас уже на финальном этапе — подготовка русифицированной версии платформы: пока идет согласование всех переводов с вендором. То есть совсем скоро наши пользователи смогут работать в русскоязычном интерфейсе. Для нашего рынка это важно, потому что англоязычный интерфейс смущает многих.
— Писать запросы тоже можно будет на русском?
Писать запросы на русском можно было всегда. В этом смысле система напоминает Google. Если в ваших данных поле называется по-русски, например, «Продажи», то именно это можно вводить в строку поиска: система отреагирует и выдаст нужный результат. Поэтому вопрос был только в переводе интерфейса. Думаю, в ближайшие пару месяцев он будет доступен нашим пользователям полностью на русском языке.

Как работают элементы соцсети в BI-платформе

Уже на главной странице системы пользователя встречает та самая строка поиска, с помощью которой он может быстро получить нужную информацию из всего массива загруженных данных.
Остальное содержание главной страницы формируют лайки, дизлайки и подписки пользователя — примерно как в социальных сетях. Считаю, что это действительно интересное решение, учитывая, что механизм работы этих опций отлично знаком каждому.
Главная страница BI-платформы ThoughtSpot
Чтобы рассказать, что именно здесь можно лайкать и дизлайкать, давайте немного разберемся в главных понятиях.

Инсайты — так называются те самые графики, которые система с помощью механизма искусственного интеллекта SpotIQ генерирует в ответ на запрос пользователя. Каждый из них показывает потенциально полезный для анализа факт из данных в соответствии с запросом.

Пинборды — так называются преднастроенные наборы ответов на запросы: доски с инсайтами, которые пользователь уже нашел ранее и сохранил. Каждый пинборд можно настраивать и модифицировать, добавлять или убирать с него элементы, подписываться на них, чтобы использовать в дальнейшем. Также на главную страницу система выводит пинборды, которые пользователь просматривал и изменял последними.
Каждый пинборд представляет собой набор графиков
А еще можно подписаться на своих коллег, если они разрешили просматривать их пинборды. Эту опцию можно использовать для обмена опытом: если у одного сотрудника появился новый инсайт или новый пинборд, другие смогут его изучить и, возможно, использовать у себя в таком виде или с какими-то изменениями.

Также на главную страницу под заголовком «Did you know?» выведен список инсайтов. В них могут быть как те факты, которые и так известны пользователю, так и те, о которых он даже не догадывался. На список инсайтов влияют лайки и дизлайки пользователя.

Как работают инсайты в ThoughtSpot

Инсайты считаются сердцем системы ThoughtSpot. В общем списке они выглядят как карточки с цифрами (фактами из данных), по которым можно выбрать интересующую информацию. Клик по карточке открывает график с данными, на которых сгенерирован инсайт.
Список сгенерированных инсайтов на главной странице ThoughtSpot
Графики в инсайтах кликабельные: можно проваливаться в детализацию по выбранному показателю. При этом стоит отдать должное: детализация здесь работает до самого «нижнего» уровня и при этом не нужно кликать 100500 раз, чтобы до него добраться.
— Ну да, графиков много, но я бы не назвал это инсайтами… Не понимаю, как это поможет мне решить какую-то бизнес-задачу?
Если инсайт не дает не дает нужной информации и не помогает разобраться в проблеме, в силу вступает элемент социальной сети — лайки и дизлайки. С их помощью мы обучаем систему, даем ей понять, что этот инсайт не релевантен для меня. Например, мне неинтересно смотреть в разрезе ID товаров — это слишком детальные данные, которые мне здесь не нужны. Я ставлю дизлайк и объясняю системе, почему этот инсайт был мне неинтересен. Система запоминает эту информацию.
Пользователь может обучать систему, оценивая сгенерированные инсайты
К каждому инсайту система дает еще подборку инсайтов. Например, если мы переходим в инсайт с графиком по продажам в разных городах, под ним будет то, что касается детальной информации именно по городам. Например, здесь мы можем увидеть, что самый крупный заказ был в Челябинске. Из этого графика можем дойти до мельчайших подробностей этого заказа: узнать, что именно продали, когда, сколько, на какую сумму, как звали клиента, каким способом был доставлен товар, сколько составила наша прибыль с этого заказа и так далее.

Как работает инструмент SpotIQ

— Расскажи подробнее, как работает поиск в системе и какими должны быть запросы пользователя?
В поисковой строке можно вводить ключевые слова, названия столбцов и даже названия ячеек в ваших таблицах с данными. Кроме того, искать можно и по заранее заданным синонимам этих ключевых понятий — с их помощью пользователь может самостоятельно обучать систему. В соответствии с параметрами поискового запроса система мгновенно выведет график.

Например, мы продаем мебель и хотим посмотреть, как в последнее время продается конкретный товар. Вводим в строке поиска «Продажи», «Стулья», «Дата заказа» — и система тут же строит график, на котором мы видим динамику продаж стульев.

Если я вижу на графике резкое падение или резкий рост, могу отметить эти две точки и попросить систему с помощью инструмента SpotIQ analyze найти инсайт по этому поводу. То есть какую-то аномалию в данных, из-за которой могло произойти это падение.
Изменения на графике можно проанализировать с помощью инсайтов
Система предложит выбрать разрезы для поиска инсайтов: город, сегмент, категория товара, ID заказа, способ доставки, имя клиента, продажи, дата заказа… Можно выбрать данные о возвратах, чтобы увидеть, не было ли их слишком много в этот период, или данные о менеджерах, чтоб проследить за продуктивностью каждого.

После этого выбираем алгоритм для поиска. Параметры этих алгоритмов тоже можно настраивать — такая опция редко требуется обычным бизнес-пользователям, но может быть полезной продвинутым аналитикам. Если же я доверяю тому, как преднастроили все это в моей компании, можно просто пользоваться.

Система за несколько секунд обработает все эти данные и выдает на их основе список инсайтов. Отсюда мы можем узнать, например, что резкий рост продаж стульев в декабре вызван одним очень крупным заказом, а в январе такого заказа не было, поэтому мы и наблюдаем заметное падение. Также в инсайтах может быть информация о продуктивности менеджеров или об остатках на складах.

Попытка диалога с искусственным интеллектом

Знать, что умеет программа, конечно, важно. Но бизнес-аналитику необходимо в первую очередь думать о нуждах своих клиентов. Значит, надо выяснить, как программа умеет отвечать на вопросы и помогать пользователю в решении бизнес-задач.
— А если я напишу в строке поиска «Почему упали продажи»?
Вопроса «почему» система, конечно, не поймет. Но пользователь ThoughtSpot может обучать движок SearchIQ, задавать формулировки и термины, которых в системе не было. Например, «самые горячие продажи» или «максимальная сумма заказа».
— А если это вопрос о том, какие товары дают мне 50% выручки?
Так можно, но это будет не так, как мы привыкли: чтобы система вывела такие данные, придется писать формулу. Обычный бизнес-пользователь с этим не справится, но если компании часто нужно быстро находить такой факт, это может сделать аналитик еще на этапе настройки.

Как система работает с данными

— Если модель нужно собирать из нескольких массивов данных, как будет выглядеть этот фреймворк?
Загружаются таблицы либо это могут быть ваши базы данных и создается worksheet — рабочий лист, как это принято называть в ThoughtSpot. Чтобы это сделать, мы указываем, какие источники нам нужны. Появляется меню с полями, выбираем нужные для наших бизнес-пользователей, которые будут пользоваться этим «воркшитом».
— А где и как мы связываем данные?
Для этого добавляем джойн. Например, мне нужны возвраты товаров. Я выбираю, по какому полю соединить: беру ID заказа, Order ID. Называю этот джойн «Возвраты». После объединения данных создаем свой worksheet, который позволит в рамках системы создавать уникальную модель только с теми данными, которые мне нужны.
— Интерфейс мне напоминает Tableau. А как система работает с данными? Например, для Tableau нужны только чистые данные, а вот Qlik в этом плане всеядный. К чему ближе ThoughtSpot?
Ближе, пожалуй, к «Клику», так как сюда тоже можно загружать неочищенные и непредобработанные данные. Другой вопрос, насколько информация будет достоверной, если данные не подготовлены.

Здесь также можно удалять дубликаты, делать нужные автозамены, добавлять вычисляемые поля. Просто если это делать именно на уровне ThoughtSpot, то потом придется повторять то же самое для других BI-систем, которые использует компания. Конечно, логично подготовить данные для анализа, а уже потом загружать в систему.

Каким компаниям нужен ThoughtSpot

— Ты упомянула, что вы часто внедряете ThoughtSpot в компаниях, у которых уже есть другие BI-системы. Зачем им еще одна?
ThoughtSpot подходит компаниям, которые развиваются по пути Data Driven: у них много данных, которыми пользуется большое количество сотрудников. Потому что в таких случаях, например, приходит запрос на отчет от 10 человек, а у меня всего 3 разработчика. И все будут ждать, пока отчет будет готов, даже если он какой-то совсем простой.

В этом и заключается преимущество: вместо того, чтобы ждать, они могут зайти в систему, ввести несколько запросов и получить ответы. Фишка именно в том, что компания не только позволяет своим сотрудникам пользоваться данными, но и обеспечивает мгновенный доступ к ним.
Особенность системы еще и в том, что лицензирование идет не по количеству пользователей, а по объему данных. Загружаете терабайт данных — и с ним может работать хоть 10 тысяч пользователей. В условном Walmart, который пользуется этой системой, любой сотрудник может прийти и задать вопрос: какой у меня темп продаж сегодня или на протяжении недели? И сразу же получить ответ, не дожидаясь полного отчета.
— Если пользователь не может быстро получить отчет из BI-системы, сейчас он выгружает данные в Excel и строит его там. Получается, ThoughtSpot должен исключить этот сценарий?
Да, и это тоже. Это удобно в случае, когда сотруднику нужен ответ на разовый вопрос, а не полноценный отчет. Его можно не только получить от системы, но и показать руководителю в виде аккуратной диаграммы или графика. Кстати, выгружать данные в Excel тоже можно, но пользователям об этом, может, лучше и не знать: пора перестать это делать и пользоваться современными инструментами :)

Мои выводы по итогам знакомства с новой BI-платформой

Какие-то вещи в ThoughtSpot мне действительно показались интересными. А какие-то откровенно разочаровали. Например, вот эти самые инсайты. Насколько я успел увидеть, чаще всего они выводят максимальные или минимальные значения: самый крупный заказ, самое значительное отклонение от плана. Мой диалог с искусственным интеллектом, как вы могли увидеть, не удался.

Впрочем, надо понимать, что я наблюдал за работой на демо-данных. По словам Ани, если данных будет больше, система выведет мне ответы на множество бизнес-вопросов. Пока же я увидел, что продажа условных стульев резко снизилась, но куча сгенерированных инсайтов не помогла мне понять, почему это произошло.

Возможно, среди инсайтов можно найти нужный показатель, но обычному бизнес-пользователю сделать это, кажется, будет непросто. По-прежнему нужен «переводчик» — аналитик, который разжует и объяснит, что означают все эти графики. На какие-то вопросы бизнеса можно получить ответы только после добавления отдельных формул, и для этого тоже нужен аналитик. А значит, один на один с бизнесом этот искусственный интеллект оставить пока нельзя.

Но! Все это — лишь первые и, возможно, поверхностные впечатления. То, что Navicon взялся за внедрение новой BI-платформы, явно показывает: наш рынок — живой и динамичный. А значит, развивается. В том числе, с помощью новых инициатив.

Спасибо Ани Манукян, которая не только согласилась провести для меня демонстрацию продукта, но и дала понять: у нас есть классные молодые специалисты. А это еще раз подтверждает, что рынок BI в России растет.
Если вы еще не получаете все новости и полезные материалы Института бизнес-аналитики первыми, то подписаться на рассылку можно внизу этой страницы. Надеюсь, статья была вам полезной и подарила парочку инсайтов.
Читайте также
Подпишись на рассылку и получи в подарок «Каталог лучших отраслевых дашбордов»!
Хочешь получать актуальные статьи о визуализации данных?