Как устроен скоринг в индустрии каршеринга. Часть 2. Определить агрессивного водителя за 5 секунд

В прошлой статье мы рассмотрели алгоритм скоринга, основанный на резких ускорениях и торможениях. Результаты скоринга по такому алгоритму слабо коррелируют с вероятностью ДТП. В этой статье мы обратимся к более продвинутым алгоритмам анализа стиля вождения, основанным на значениях скорости, оборотов двигателя и показателях акселерометра.

lreh8r3u7dhm4wl7_daix_lcpsu.jpeg
Для анализа мы будем использовать данные 250 000 поездок 43 000 пользователей каршеринга, из которых 250 являлись виновниками ДТП. На анализируемых автомобилях установлены телематические устройства Remoto. В статье мы рассмотрим две группы водителей — агрессивные и аккуратные. Агрессивные водители определяются как водители, неоднократно совершающие нарушения правил дорожного движения.

Для начала проанализируем среднюю скорость движения и средние обороты пользователей, не попадавших в ДТП и виновников ДТП.

acr1amx5otc94lstswqdn7jb8b0.png
Рисунок 1. Средняя скорость
c2p-qxwg0ifcw9mk_0c2kxrxvck.png
Рисунок 2. Средние обороты двигателя

На гистограммах 1 и 2 синим и оранжевым указаны показатели пользователей без ДТП и виновники ДТП соответственно, где пунктирные линии — медианы. Видно, что средние показатели пользователей с ДТП и без — слабо отличаются. Это говорит о том, что большую часть маршрута водители ездят одинаково.

Далее мы отобрали 10 водителей: 5 с агрессивным стилем вождения и 5 со спокойным. Анализ данных с маршрутов этих групп пользователей показал интересную особенность — первые 5 секунд поездки агрессивные пользователи быстрее набирают скорость, а также держат выше обороты двигателя. Также агрессивные пользователи тормозят с большим ускорением при полной остановке автомобиля (на светофоре или в конце поездки). Для скорости, оборотов двигателя и ускорения мы использовали для анализа следующие значения:

  • Максимальное значение;
  • Максимальное изменение значение;
  • Среднее статистическое отклонение;
  • Среднее значение;
  • Медианное значение.


На нашей тестовой выборке было ярко видно, что максимальные обороты агрессивных водителей в начале маршрута сильно выше, чем у остальных, как и максимальное ускорение. В результате мы решили вычислить эти значение для всех 250 000 маршрутов, разделив данные на две группы: виновники ДТП и обычные пользователи.

atvp-aphdkf2fkpgmpwptwmhmos.png
Рисунок 3. Максимальные обороты на старте поездки

На гистограмме 3 показано распределение максимальных оборотов двигателя, оранжевым — поездки пользователей, виновных в ДТП, синим — всех пользователей. Пунктирные линии — медианы. Видно яркое смещение виновных в ДТП водителей вправо, т.е. в первые 5 секунд поездки эти водители держат обороты выше, чем остальные. 36% водителей из этой же группы имеют обороты выше 4800 на старте маршрута, и только 9% всех рассматриваемых водителей имеют такие обороты.

Аналогично с максимальным ускорением. На гистограмме 4 изображено распределение максимальных ускорений. У виновных в ДТП максимальное ускорение выше, чем у остальных.

u97x6otpirkciq1xatshnyjommq.png
Рисунок 4. Максимальное ускорение на старте поездки

Теперь рассмотрим не только начало поездки, а все пятисекундные интервалы с моментов полной остановки и пятисекундные интервалы до полной остановки. Для каждых 5 секунд начала движения посчитаем максимальное значение оборотов двигателя и максимальное ускорение. Затем для каждого пользователя найдем максимальные значения.

Самое большое отклонение для начала движения показывают максимальные обороты, а для остановок — максимальные ускорения.

0xjbxz0hmpekfp00vfbccksepmm.png
Рисунок 5. Максимальные обороты двигателя при начале движения

g1dvneruy2wpoy7r9i_l3g1xtss.png
Рисунок 6. Максимальное ускорение при остановке

В итоге получается, что 80% водителей, виновных в ДТП, имеют обороты больше 5000, когда лишь 20% всех водителей имеют такие обороты, другими словами 80% водителей виновных в ДТП, входят в группу 20% всех пользователей. Также 52% водителей виновных в ДТП, имеют обороты выше 5800, при том, что 10% всех пользователей имели такие обороты. С ускорением при остановке похожая ситуация, хотя визуально сдвиг меньше, 60% водителей с ДТП показали ускорение больше 120, когда только 20% всех водителей имеют такие ускорения при остановках.

Мы рассматриваем максимальные значения по причине сильного варьирования показателей агрессивных водителей, отклонение данных одного агрессивного водителя всегда выше, чем у спокойного водителя. Другими словами, спокойные водителя обычно ездят одинаково, когда агрессивные водители могут проехать, как и спокойно, так и чрезвычайно агрессивно, сложно сказать почему и что на это влияет (может быть как настроение, так и спешка и т.д.).

Мы рассмотрели старты и остановки в пределах поездки и получили хорошее отклонение для водителей с ДТП относительно всей массы водителей. Водители с агрессивным стилем вождения чаще всего являются виновниками ДТП, 80% виновных в ДТП попадают в группу агрессивных по значению максимальных оборотов при старте движения. На эту группу водителей стоит обращать внимание операторам каршеринга, т.к. для них ДТП — это всегда убытки.

Другими важными элементами поездки являются повороты, о них я расскажу в следующей статье.

Автор: Кирилл Кульченков, kulchenkov32, бизнес консультант, Bright Box.

© Habrahabr.ru