Расчет рентабельности инвестиций и другие задачи дата-сайентиста

5cd965ea7b10b2abd4178b4a17c2b7ec.jpg

Как специалисты data science (DS) оперативно рассчитывают рентабельность инвестиций в проект (ROI) на реальной практике, то есть в ситуации, когда нет актуальной информации о необходимых данных? К примеру, чтобы рассчитать компонент оттока в Lifetime Value (LTV), требуются месяцы аналитики. К каким инструментам прибегают, чтобы ускорить эти процессы?

Для быстрой оценки ROI есть классический метод оценки смежных компонентов: охвата, влияния и усилия. 

Охват можно оценить, исходя из плана проекта, где обычно содержится описание клиента, или по данным продуктовых и финансовых руководителей, которые уже составляли дорожную карту предприятия с подобными прогнозами.

Влияние — это ожидаемые улучшения для целевых клиентов, обеспечиваемые продуктом. Такие улучшения достаточно точно оцениваются по аналогичным кейсам, а если таковых на рынке нет, можно использовать общую формулу, по которой на ранних этапах разработки продукта ожидается улучшение на 10–20%, для относительно зрелого улучшение на 1–2% уже будет существенным. 

Усилия можно оценить в технических неделях или неделях дата-сайентиста, необходимых для запуска и итерации решения. Тут тоже можно обратиться за оценкой запусков командой схожих проектов и аппроксимировать ее для нынешнего проекта. А если такой проект запускается командой впервые, то поможет разбивка этапов запуска на контрольные точки.

После подобного анализа стоит отметить компоненты, которые оценивались с низким уровнем достоверности, и проверить чувствительность общей приоритизации проекта, когда неопределенная оценка отклоняется на 10 или 30%. При слишком сильном отклонении приоритизации соответственно снижается, а проект может быть перенесен или вовсе отменен. 

Этот метод в своей книге «Как быть успешным в Data Science. Эффективное управление проектами и развитие профессиональной команды» описывают опытные руководители множества проектов Цзикэ Чонг и Юэ Кэти Чанг. Они раскрывают аспекты работы DS и отвечают на вечный вопрос: чем дата-сайентист отличается от менеджера? Строго говоря, тем, что использует статистику. Как и для чего это делать, авторы показывают на собственном опыте и реальных кейсах, а заодно дают картину перспектив DS-специалистов в современных компаниях. Стоит ли осваивать соответствующие навыки, как это делать, как тут поможет процесс CPR, что такое модель GROW, актуальна ли сегодня диаграмма Венна из 2010 года и так далее. Книга послужит хорошим стартом для карьеры современного руководителя и аналитика.

© Habrahabr.ru