Dashboard, dashboard, сколько тебе жить осталось?

День футуризма

Длинный отпуск в одиночку — время передумать вопросы, до которых не хватало времени весь год. Последние 10 лет я занимаюсь дашбордингом. Много вокруг него всего остального — data инжиниринга, бизнес-анализа, дизайна, консалтинга и даже data governance, но конечном счете я и мои команды 10 лет делаем дашборды для бизнеса. Сделали их тысячи, столько же похоронили, реанимировали и закопали снова). Достигли мы в этом если не совершенства, то почти его. Отстроили процессы, чеклисты, стайл гайды, пришли к оптимальным шаблонам, знаем как понимать скрытые требования заказчика, как внедрять отчеты в процессы, как обучать; сделали много ошибок и много из них выводов, короче видим задачи насквозь и различаем признаки фейлов до старта. Разве что книг мало читали — в основном те, что с картинками, можно было и больше.

И вот как всегда в жизни, ты приходишь к точке когда уровень насмотренности в какой-то сфере достигает критической точки и генерирует в твоей голове сначала ощущение, потом гипотезу, а потом и убеждение. Так эволюционировали и мои взгляды на дашборд — главную парадигму bi последних 10 лет, ставший для BI тулов как бы абсолютной идеей, острием всей конечной ценности,  то куда в итоге все должны смотреть и радоваться обладанию дорогостоящей системой. BI-cистема для крупной компании с условными 2500+ юзерами стоит. приличных денег, грубо округлив, пусть будет 800$K в год (300$K на софт и 500$K на команду) — у кого-то чуть меньше, у кого-то сильно больше. Чтобы окупить эти затраты нужно генерить много бизнес-пользы, ну прям много — кейсов ускорений решений, повышения их качества и плотности, сейвинга времени сотрудников и т.д. (тема отдельной статьи).

И вот, летишь ты в отпуск и думаешь,  что и как делать в новом году еще круче, чтоб верить в это самому и заражать других. Включить в себе, блеать, футуриста. Так вот в дашборд, как в верховный смысл BI, — верить уже не получается. Сейчас модно говорить про смерть bi каким мы его знаем, про смерть дашбордов — звучит прикольно, но это кликбейтный бред вендоров и заканчивается всегда он саморекламой. Мне же хочется не столько накинуть на вентилятор, сколько поразбираться и понять для себя что-то, обрести новые идеи или занизить ожидания. Поэтому притормозим. Тут нужна, мать ее, завязка.

Симуляция счастья

5d4042e4861fad5ea141d8bfa33a710f.jpg

Когда-то дашбординг, как форма коммуникации бизнес пользователя и данных, стал передовым, сменив фактически спредшиты (они же эксели для простоты) — прорыв был в красоте, интерактивности, шеринге и автообновляемости. Произошел рывок в Self-Service BI adoption — принятии BI решений в компании как в части работы с готовыми отчетами, так и в самостоятельной разработке пользователями. Но далее рост остановился на уровнях ~ 25–35% целевой аудитории. Есть несколько исследований — от Eckerson Group, BI Survey,  Gartner, Thoughtspot на эту тему — сравните с вашим замером — мои данные и ощущения совпали.У того же Gartner была хорошая фраза, что self-service технология оказалась только в той степени полезна, в которой пользователи оказались способны себя обслуживать.

С тех пор как дашборды пришли всерьёз в корп реальность, помимо самой пользы наблюдается и симуляции и иллюзии пользы дашборда, а также искажения пользовательских вокрфлоу, неосознанные конечно. Мы сами хотим обманываться, они же такие у нас красивые, наши дашборды. Вот несколько примеров таких явлений:

  • Уводит куда-то в сторону… — пользователь тратит время на то, чтобы понять, что говорит ему большой, красивый отчёт, а не то, что его реально самого интересует;

  • Обсуждать не значит пользоваться… — пользователи всегда готовы давать замечания и пожелания, но это не значит что они планируют пользоваться этим отчётом в работе.

  • Чужому не верится… — для многих недоверие к чему-то, сделанному не ими, оказывается непреодолимым. Боль всех reporting factory сервисов;

  • А,  тут начать думать придется… — люди склонны не пользоваться отчетами после разработки, даже если они объективно оказались полезными. Успокаивает сам факт наличия нужного отчета, а времени чтоб зайти и открыть, отфильтровать и найти инсайт — нет, все убивают текущие бизнес задачи;

  • Любая задача = дашборд — пользователь всегда захочет дашборд под любую задачу, слайды для презы или ad-hoc для проверки гипотезы. Делая каждый раз борд, мы размножаем визуальные вариации, которым пользуются недолго, переключаясь на следующую новую задачу и порождая новый борд и т.д.

  • Борд сам стремится к перегруженности,  как самурай к смерти — в стремлении дать пользователю гибкость и вариативность мы делаем сложные «антидашборды» добавляя +100500 фильтров, переключателей, снижая при этом понятность, инсайтность, быстродействие. До определённого момента это может работать на повышение adoption отчета, но в конечном счете убивает в нем дашборд.

  • Self-service не есть однозначное благо — нельзя все, что делают пользовали относить к пользе. Большая часть это пробы и «заброшки», создающие массу, которая выглядит обманчиво внушительно, но дает 0 ценности.

  • Дорогая суета. — классический извращенный цикл аналитической задачи — есть запрос на отчет, запускается анализ доступных данных, их допобработка, дизайн борда, уточнение логики — и когда запрос менеджера отвечен bi-отчетом, запрос уже изменился, уточнился, дополнился, сменился новым. Упорный аналитик не сдается и «бежит за поездом» — уточняет требования, переделывает, напрягает доп. экспертов, добавляет данных. Так создается «движуха», за которой часто не случается deсision support или принятое решение имеет микро-масштаб по сравнению с затратами на производство этой поддержки. Иногда сама эта движуха на пути к абстрактно «желаемому» совершенству логики и визуализации незаметно становится самоцелью работы.

Здесь, я смешиваю и аналитические дашборды и операционные (справедливое замечание Ромы Бунина). Это так, разберемся с этим чуть далее.

Обобщая эти разрозненные набросы, я бы выделил 3 главные причины стагнации в принятии BI:

  1. Бизнес-заказчик преувеличивает пользу и не хочет признавать, что не часто пользуется правильным отчетом, к разработке которого к тому же имел отношение. Это может быть истолковано как его же некомпетентность.

  2. BI разработчик в процессе долгой разработки формирует эмоциональную связь с отчетом, и любит его в итоге больше, чем он реально заслуживает, может не замечать его оторванность от жизни и неактуальность, винить пользователя в низком usage rate. Я часто замечаю, что даже самые крутые наши отчеты, в той или иной степени, переоценены нами.

Аналитики ушли в мир BI ноутбуков

Дашборды, как упоминалось выше, лучше делить на типы. Упрощая, выделим три, как мне кажется, наиболее контрастные:  стратегические, операционные, аналитические.1 — Стратегические — быстрый обзор состояния и триггеров для решений; фокусировка на высокоуровневых показателях; простота; интерактивность около нуля; фильтров нет или почти нет; аудитория — топы; 2 — Операционные — мониторинг состояния метрик в различных разрезах, сравнениях, динамиках; больше информации, сложнее и дольше понимание; понятные отработанные пользовательские сценарии; более широкая аудитория middle-, low-level менеджмента; 3 — Аналитические — требуют дополнительного контекста; сложные для восприятия и инсайтов, более глубокие по возможностям анализа; неочевидные пользовательские сценарии; высоко-интерактивные, с большим количеством фильтров.

Так вот, первые два типа можно сейчас объединить — оба про операционный мониторинг, просто на разном уровне обобщения, есть отличия в подходах к дизайну, но цели едины — вывести информацию, максимально ускорив принятие решения пользователем. Третий же тип вообще ошибка и наша BI-ная гордыня — строить для всего дашборды. Мы вроде уже все поняли, что цель дата экплорайшна изначально порочна для дашборд-фокусированных BI тулов (типа святой троицы табло, пауэрбиай и клика). Мы делаем вид, что это не так, создавая из отчетов «франкенштейны» с кучей фильтров и переключателей, чтобы заложить в него максимум возможностей для непрогнозируемых пользовательских сценариев исследования. Вендоры по схожим причинам насаждают функции исследования для casual users (а ля web edit) и wrangling tools (типа tableau prep). Но истина — как у классика — для Графа де ла Фер (аналитика) этого слишком мало, а для Атоса (менеджера) этого слишком много. И нет, ситуативное использование отдельными вашими коллегами не опровергает этот факт.

Еще мы видим активное распространение ноутбук-тулов (перерожденных старых SQL IDM систем), объединяющих в себе удобный code-based (иногда drag-and-drop) querying на sql/python и визуализацию данных в таблицы/графики. Такой «BI ноутбук» содержит актуальные данные и контекст — все что нужно, чтобы гибко проводить и менять анализ, визуализировать, описывать, шарить и проверять чужой на разных этапах. Эти условные «BI ноутбуки» расставили точки над «и», отъев себе из BI тулов изрядную часть времени аналитиков. Эта мысль глубже раскрывается в статьях тут и тут правда с выходом на рекламу тула Count — вероятно действительно неплохого (попытка очеловечивания олдскула типа jupiter и zeppelin). Убьют ли ноутбуки data wrangling функции условных табло и клика? — хз, но в них точно больше жизни.

Итак, BI-ноутбуки лучше помогают аналитику работать и изучать данные, извлекая быстрые ответы на вопросы, но это не интерфейс для decision-maker. Но что, тогда в итоге должно будет быть доминирующем аналитическим воркфлоу для лиц принимающих решения.

По факту,  цель нового BI — ликвидировать временной и понятийный блокер между десижн-мейкером и инсайтом-решением-действием при этом:- найти новую форму самообслуживания,  исключив не только кодинг, но и поиск данных, drag-drop разработку, верстку и часть анализа данных, а возможно и вообще сократив до нуля сам self-serve компонент как генератор лишних потерь,- объединить для пользователя преимущества оперативного и вариативного BI-ноутбука и преднастроенность, персонифицированность дашборда.

Новые BI формы — что в итоге идёт на смену

Что рассуждать — BI-вендоры для нас уже все придумали. Конечно — все модное из последних конференций — Augumented analytics,  NLP search AI based search, insight generation. Многие уже встречали сверхоптимистичный прогноз Gartner о том, что к 2025 году 75% data-историй будут автоматически генерироваться augumented analytics технологиями.Вот только реальное воплощение этих функций для разработчика и пользователя в полном тумане. Ощущение, что вендоры сами пока не понимают нового воркфлоу. BI-команды не видят ценности в сырых AI-сервисах, бизнесу все равно, а проблема низкого качества данных умножают на 0 вcе попытки тесты. Вопросов много. Но давайте сначала с наиболее понятного мне вывода:  дашборды не умерли, они и не жили полноценно (как мы с вами хотели). Уровень требуемой персонификации, вариативности и оперативности аналитики будет убирать преднастроенные дашборды как излишнюю, дорогую и местами вредную прослойку, неоптимально предопределяющую пользовательский опыт. Дашборды не умрут, скорее займут небольшую нишу стандартизованного устойчивого во времени менеджерского репортинга, где форма и логика устоялись и не меняются часто. Ресурс и фокус аналитических команд перейдет на новые BI формы — условных приложений-конструкторов, генерируемых пользователем и автогенерируемых под пользователя из разных сущностей. Что это будет? — вот возможные отличительные характеристики нового BI:

  • Новый интерфейс с customer grade UX для навигации non-technical бизнес-пользователя к инсайтам (тема пинбординга раскрывается далее);

  • Google-like поиск с толковым и обучающимся движком с использованием live-query и без предагрегаций — будет генерировать свои и выдавать чужие чарты по запросам пользователя на естественном языке;

  • Текстовые и визуальные AI-генерируемые инсайты — нарративы, подсветка зон для фокуса, потенциальных инсайтов в виде как текста, спец.чартов, цвета;

  • Каталоги артефактов своего и чужого поиска и дальнейшим процессингом файндингов через таск-трекинговые системы;

  • Нормальные «умные» алерты — текущие опции из коробки реально не взлетели из-за примитивности, ручного привода и ограничений в использовании;

  • Проваливание в BI notebooks для ухода в реальный data exploration, обзор логики и lineage для тех, кому хватает дата грамотности;

  • Новые средства коммуникаций вокруг BI файндингов с более тесную интеграцией с корп мессенджерами — аналогичные функции в текущих BI решениях не используются главным образом потому, что обсуждать нечего — инсайты очень глубоко в графиках, а общение в BI инструменте ненативно пользователю;

  • Лайв коннекты BI-системы с базами хранения данных (часто облачных) — задержка в актуальности будет сводиться к нулю или минимуму стриминговыми DWH решениями. Эффективность NLP функции будет повышаться «дружбой» с моделям данных ключевых вендоров (AWS, Bigquery, Snowflake, etc), новыми коннекторами;

  • Conversational BI - корпоративные чат-боты и голосовые ассистенты — следующий шаг за NLG в отказе от self-serviсe операций пользователя, еще менее готовый на текущий момент, но логичный.

  • Новый интерфейс с customer grade UX для навигации non-technical бизнес-пользователя к инсайтам (тема пинбординга раскрывается далее);

  • Google-like поиск с толковым и обучающимся движком с использованием live-query и без предагрегаций — будет генерировать свои и выдавать чужие чарты по запросам пользователя на естественном языке;

  • Текстовые и визуальные AI-генерируемые инсайты — нарративы, подсветка зон для фокуса, потенциальных инсайтов в виде как текста, спец.чартов, цвета;

  • Каталоги артефактов своего и чужого поиска и дальнейшим процессингом файндингов через таск-трекинговые системы;

  • Нормальные «умные» алерты — текущие опции из коробки реально не взлетели из-за примитивности, ручного привода и ограничений в использовании;

  • Проваливание в BI notebooks для ухода в реальный data exploration, обзор логики и lineage для тех, кому хватает дата грамотности;

  • Новые средства коммуникаций вокруг BI файндингов с более тесную интеграцией с корп мессенджерами — аналогичные функции в текущих BI решениях не используются главным образом потому, что обсуждать нечего — инсайты очень глубоко в графиках, а общение в BI инструменте ненативно пользователю;

  • Лайв коннекты BI-системы с базами хранения данных (часто облачных) — задержка в актуальности будет сводиться к нулю или минимуму стриминговыми DWH решениями. Эффективность NLP функции будет повышаться «дружбой» с моделям данных ключевых вендоров (AWS, Bigquery, Snowflake, etc), новыми коннекторами;

  • Conversational BI - корпоративные чат-боты и голосовые ассистенты — следующий шаг за NLG в отказе от self-serviсe операций пользователя, еще менее готовый на текущий момент, но логичный.

Эту концепцию неплохо осмысляет thoughspot, которые не имеют груза дорогостоящего легаси продукта и сразу создают нечто новое, толкаясь от чужих тупиков. Ребята жестко набрасывают на традиционный BI (имея ввиду уже tableau, Qlik, PBI и т.д., как изменчив мир), но вот это демо порадовало проработанностью опыта пользователя. Понравился термин — pinboard (воистину, шаришь в маркетинге — начни со своего нейминга)) — тоже борд, но формируемый пользователем через сохранение элементов (чартов, инсайтов, алертов и т.д.), генерируемых поисковым движком, извлекаемых из чужих наработок или собираемых вручную. Нативно мышлению здесь выглядит и движение пользователя по drill-down / drill-up сценариям.Похожий концент контектной аналитики развивает Yellow Fin BI.

Вообще подход с минимальной преднастройкой, гибким составлением панелей из элементов и интерфейс универсального гугл-поиска — кажется проще текущих сценариев self-service и перспективнее с точки зрения вовлечения новой «спящей» аудитории бизнес менеджмента и нового прорыва в self service BI adoption с 30 до 60–70%. Задача старательно верстать и размещать элементы заранее должна будет уйти — она слишком трудоемкая, и при этом в ней уже все понятно и шаблонировано, чтобы убрать отсюда ручной труд. Пользователь по сути может конструировать себе пинборды по темам с той сложностью, к которой он готов, собирая их из готовых элементов.
Для кого и это будет ту мач, остается сценарий использования готовых ролевых пинбордов (читай здесь «дашбордов»).

Хуже дела у лидеров, имеющих большую инерцию, — Qlik, Tableau и PBI тоже инвестируют в эти идеи, но их разработки, на мой взгляд, не содержат нового понятного и единого интерфейса, связывающего NLP-сервис и инсайт-генерацию с базовым продуктом. Есть отдельно дашборды, отдельно AI сервис. Работа внутри дополнительной прослойки в слое данных (как у tableau и Qlik), вероятно, будет сильно сдерживать взлет технологии — построение всей обвязки со своими published data source кажется большим ограничением того же табло. Инсайт-генерация PBI сейчас похожа на кучу текста с описанием отклонений, большая часть из которых малозначима, а текстовая форма убивает все преимущества визуального анализа, и превращает пользователя в читателя (здравая мысль Димы Гудкова).

Пока сами вендоры дают себе еще 5–7 лет на доработку и обучение еще семантически «глупых» NLG движков, давайте представим модель трансформации самого BI сервиса,  процессов и команды, по ходу онбординга этого подхода.

Очевидно, что взлет AI функций будет повышать автономность бизнес-пользователей и снижать поток ad-hoc запросов и запросов на разработку отчетов на data / BI аналитика. Ресурс BI команды начнет высвобождаться, куда его придется перенаправлять?  Есть ощущение, что в центр внимания BI команды попадет продукт и всяческая поддержка процесса обучения AI-движка на распознавание данных, поисковую эффективность, настройку интерфейса для пользователя.
Примеры активностей, которые, на мой взгляд, станут приоритетными:

  • Вывод работы с метадатой на сверх-уровень. Потребуется переброска ресурса от производства витрин и отчётов, на адаптацию под NLP источников данных — навешивание тегов, синонимов, форматов будет жизненно необходимо, чтобы обеспечить качество авто-интерпретаций.

  • Добавление новых и новых данных в перечень доступных и понятных AI движку,  настройка интеграций с базами данных, обслуживание и обеспечение работы коннекторов

  • Обучение пользователей работе с новым интерфейсами, поисковым запросам и повышение доверия сервису

  • Настройка и обслуживание моделей алертинга и инсайтов — нет понимания целевой модели администрирования этих функций, но кажется эта история будет требовать ручного аудита

  • Сборка и поддержка готовых «пинбордов» под основные роли, для прямого использования или кастомизации

  • Сертификация отдельных чартов, пинбордов, датасетов для приоритетной выдачи и чистка лишнего

  • Разработка отдельных «сложных» репортинговых моделей со спец логикой, которые не сгенерирует машина. Примеры — аллокация затрат, прогноз численности сотрудников, специфичные воронки кандидатов и т.д.

  • Самостоятельный анализ данных, insight-hunting - отращивание экспертизы бизнес консалтинга

  • Работа над качеством данных - с новыми силами в старый бой

Нужно ли менять BI тул? — кажется нет, по крайней мере по причинам эволюции BI. Виденье сейчас у всех похожее, есть отличия реализациях, но говорить кто первый соберет работающий концепт сложно. Вероятно народный рейтинг систем будет меняться в зависимости от успешности адаптации под новые реалии и будет исход клиентов в новых и дерзких игроков. Так, если вы выбираете BI систему и не связаны еще вендорскими предрассудками, посмотрите на thoughtspot из взрослых систем (не на правах рекламы, не является инвестиционной рекомендацией)) или на arria (NLG расширение для PBI, Tableau Qlik и других), или на молодые и нишевые решения типа narrative bi,  Outlier,  Lexio,  datastories (спойлер — скоро их всех купят), а я буду ждать новых откровений от чудотворных крестов tableau.

Что можно начать делать заранее?  Работа,  как известно, — заполняет все отпущенное ей время, и, если осознанно не букать ресурс, движения не будет. Варианты: — сделать роадмап кардинального решения проблем с качеством для критических данных для компании (сотрудник, клиент, кандидат, затраты, платежи, отгрузки, запасы и т.д.). Если будут дыры в этих данных, скачок в новый BI вы не совершите. Не поздно взяться за вопрос глобально — развернуть хорошее DQM решение.— копить базу инсайт-кейсов,  какой бы ни был новый потенциал BI системы, настраивать адекватность ее инсайтов придётся вам с командой тем или иным образом (для этого нужна будет накормленная база)— проинвестировать в модернизацию data стека — data warehouses, data lakes, lakehouses и прочий data mesh)) — устаревшие решения заблокируют вам модернизацию BI— заняться причесыванием метадаты и отладкой процессов ее поддержки— перейти от финансирования BI как кост-центра к новой модели фондирования BI проекта и метрикам эффективности, завязанных на выручке и монетизации репортинга — количество дашбордов и отчетов скоро окончательно перестанет волновать кого-либо.- ничего не делать и не париться (тоже норм вариант).

Все эти рассуждения могут у кого-то вызвать ощущение безотлагательности каких-то перемен или наоборот неважности, нематериальности новых трендов, но это футурология, полезная для формирования направлений трансформации, но не более. Реальное понимание текущих задач, ограничений в вашей компании и потенциала ваших текущих инструментов будет всегда важнее новых фич, до которых ещё надо дожить. А польза от BI должна производится здесь и сейчас. So, god save dashboards)

ae565f0cdce181640a351e671694269e.jpg

© Habrahabr.ru