«Итоговая стоимость поездок через “Яндекс.Такси” в среднем на 14% выше прогнозируемой»

Алексей Скобелев в своем блоге на Medium написал о том, насколько велика разница между прогнозом и реальной стоимостью поездки в сервисе «Яндекс.Такси». Редакция vc.ru публикует материал с разрешения автора.

Я продал машину в сентябре 2016 года и с тех пор активно пользуюсь такси и общественным транспортом. Когда в октябре похолодало, я практически полностью пересел на такси. В основном пользуюсь сервисом «Яндекс.Такси», Uber как запасной вариант.

Я обратил внимание на то, что периодически стоимость поездки оказывается сильно больше прогноза стоимости, которую приложение «Яндекс.Такси» показывает перед отправкой заказа.

Прогноз и реальная стоимость

Естественно, первая мысль, которая пришла в голову —  «Яндекс» обманывает, показывает прогнозируемую стоимость ниже, чтобы клиенты заказывали машины у них, а не у конкурентов.

Я решил проверить эту гипотезу с помощью небольшого исследования. Перед отправкой заказов я фиксировал прогноз стоимости поездки — делал скриншот экрана приложения с прогнозом. Когда приходило SMS-сообщение о подаче машины, фиксировал примерное время старта поездки. По сообщению от банка фиксировал итоговую стоимость поездки, которую у меня списывали с карты, привязанной к приложению «Яндекс.Такси».

Чтобы исключить влияние времени ожидания машины на итоговую стоимость поездки, я старался быть особенно пунктуальным и выходил встречать машину заранее. В паре случаев, когда таксист меня ждал больше двух минут именно из-за моей задержки, я при расчетах вычитал из итоговой стоимости поездки стоимость ожидания.

Я проводил эксперимент с 19 октября 2016 года по 28 декабря 2016 года. За это время я сделал 132 поездки через «Яндекс.Такси». В среднем по две поездки в день. Максимум было пять поездок за день.

В общей сложности за все время эксперимента я заплатил «Яндекс.Такси» 55 074 рублей (не считая чаевые) — в среднем по 417 рублей за поездку. При этом общая сумма прогнозов стоимости по этим поездкам составила 48 310 рублей (в среднем по 366 рублей за поездку). То есть за время эксперимента я заплатил на 14% больше прогноза или переплатил 6764 рублей — примерно по 50 рублей дополнительно за каждую совершенную поездку. Это не драматически много, но все же ощутимо. И для меня подтверждает гипотезу, что прогнозируемую стоимость поездки «Яндекс.Такси» стабильно занижает.

Из 132 поездок в 100 поездках итоговая стоимость оказалась выше прогноза, в 32 поездках — ниже или равна прогнозу. Разброс отклонений от прогнозов составил от −26% до 75%.

От чего зависит разброс отклонения итоговой стоимости поездки от прогноза стоимости? Все мои поездки можно разбить на три группы:

  1. Из дома в офис. Обычно из дома в офис я еду между 9 и 10 часами утра. Я живу в районе Коптево (метро «Войковская»), работаю в Савеловском районе недалеко от метро «Дмитровская». Маршрут поездки идет либо по Большой Академической улице, а затем по Тимиризявской улице (это самый короткий путь), либо через Ленинградский проспект (путь длиннее, но если нет пробок, то быстрее).
  2. Из офиса домой. Обычно я еду домой с работы в интервале между 19–20 часами. Маршрут практически всегда идет по Дмитровскому шоссе, а затем по Большой Академической улице. На Дмитровском шоссе при этом есть полоса для общественного транспорта, которую могут использовать официальные желтые такси — это часто ускоряет движение.
  3. Все остальные поездки в широком спектре времени суток, дальности и комбинаций пунктов отправления и назначения.

Поездки из дома в офис дают колоссальный разброс уже на этапе прогноза стоимости — один и тот же путь примерно в одно и то же время суток в течение эксперимента предлагалось преодолеть, заплатив в разные дни от 240 рублей до 750 рублей в зависимости от влияния повышающих коэффициентов. А итоговая стоимость поездок в итоге отличалась от прогноза в диапазоне от -6% до 75%. В среднем переплата составила чуть более 17%.

Прогнозы поездок из офиса домой оказались самыми точными. Разброс отклонений от прогноза от −23% до 26% (в среднем почти 5%) при том, что в 26 из 32 поездках прогноз стоимости лежал в узком интервале от 280 до 320 рублей. Для всех остальных поездок разброс прогноза составил от −26% до 73% (в среднем почти 16%). Каждая третья поездка в этой категории оказалась дороже прогноза на 20% и более.

Зависимость ошибки прогноза от прогнозируемой суммы есть, но довольно слабая. Если убрать из статистики поездки из офиса домой (по ним прогноз самый точный), то по оставшимся поездкам с прогнозируемой стоимостью от 200 до 300 рублей отклонение минимальное — в среднем 13%, а для поездок в диапазоне прогнозов от 400 до 500 рублей — максимальное — в среднем 19%.

Самый искаженный прогноз оказался для утренних поездок с 6 до 9 часов утра. Для девяти поездок, которые я совершил в это время, итоговая стоимость отличалась от прогноза на 23%.

Помимо того, что прогноз стоимости поездки «Яндекс.Такси» стабильно занижает, для меня стало открытием, что прогноз оказался настолько неточным — с 95% вероятностью итоговая стоимость поездки лежит в интервале от −21% до 48% (интервал почти в 70% от исходной прогнозируемой суммы). Это большая погрешность.

Для сравнения, если взять классические соцопросы, выборка которых около 1500 человек, то при выборочной оценке некоторого параметра (например, доли сторонников Путина) в размере 10% реальное значение параметра будет с вероятностью 95% лежать в интервале от 8,5% до 11,5% (интервал в 30% от оцениваемого параметра) — это вдвое точнее, чем прогноз «Яндекс.Такси». При том, что у «Яндекса» есть данные о ежедневных поездках миллионов людей.

P.S. Другие сервисы такси я не оценивал. Вполне допускаю, что у них дела не лучше.

©  vc.ru