RFM анализ: что это и с чем его едят

В данной статье вы узнаете, что собой представляет RFM анализ, а самое главное, на конкретном примере поймёте его важность и силу.

19e9a0b1f4ea64898d72dbd69af00d72.png

Для начала начнем с краткого обзора.

Что такое RFM анализ?

RFM-анализ (Recency, Frequency, Monetary) — это метод сегментации клиентов, основанный на трех ключевых факторах:

  • Recency (Давность): Когда клиент совершил последнюю покупку?

  • Frequency (Частота): Как часто клиент совершает покупки?

  • Monetary (Стоимость): Сколько денег клиент потратил на ваши товары или услуги?

Сегментация пользователей в аналитике — это процесс разделения пользователей (клиентов) на группы или сегменты на основе определённых характеристик, таких как поведение, демографические данные, предпочтения и потребности. Это делается для того, чтобы лучше понимать и обслуживать различные группы пользователей, и позволить компаниям разрабатывать более точные и эффективные маркетинговые стратегии.

По каждому их этих факторов необходимо произвести ранжирование клиентов в зависимости от их лояльности к продукту. Количество рангов зависит от размера вашей базы данных и вашего подхода к сегментации, но чаще всего выделяют такое метод:

Давность последней покупки (recency)

Частота покупок (frequency)

Сумма покупок (monetary)

1 — недавний клиент 

1 — часто покупает

1 — большая

2 — спящий клиент

2 — редко покупает

2 — средняя

3 — давний клиент

3 — давно не покупал

3 — маленькая

После того как каждому клиенту присвоен ранг, мы получаем 27 сегментов. Далее их можно объединять, но об этом позже.

Данный вид анализа позволит лучше понять клиентов и повысить эффективность маркетинговых кампаний. Например, можно выявить клиентов, которые совершают покупки чаще, тратят больше денег и делают это недавно. А также клиентов, которые не совершали покупки в течение долгого времени, чтобы предложить им специальные предложения и вернуть их к покупкам и т. д.

Таргетированная рассылка позволит повысить ROI компании и получить больше прибыли.

Теперь, когда мы знаем общие понятия данного анализа, мы можем непосредственно приступить к разбору. Начнем, конечно, с технического задания.

Техническое задание

Основной мотив исследования такой: скоро сезон спадет и выручки в аптеке начнут падать. У компании есть механизм СМС-рассылок, но необходимо провести индивидуальную рассылку.

Для решения поставленного технического задания необходимо провести сегментацию клиентской базы с помощью RFM-анализа. Это поможет определить какие предложения можно выдвигать той или иной группе клиентов.

Соответственно, цели исследования:

  1. Провести классификацию пользователей

  2. Сформировать рекомендации — какой группе пользователей, что предлагать

Вот мы и узнали наше ТЗ. Хоть оно и не содержательное, а так чаще всего бывает в реальности, мы даже умудрились составить план действий, что является прекрасным началом. Итак, идем дальше, господа аналитики, нас ждет самое интересное!

Немного о структуре базы данных 

В исследовании использовался датасет bonuscheques из бд Apteka. В нем содержится вся информация о транзакциях по бонусной системе. Поле card является уникальным идентификатором бонусной карты клиента.

Вы обязательно должны знать, что из себя представляет ваша база данныхи из чего она состоит. Это необходимо понимать перед тем, как приступать непосредственно к самому анализу! Также необходимо узнать, есть ли какие-то нюансы по вашей базе, чтобы в будущем избежать проблем.

Если в момент покупки касса была в оффлайн-режиме, то вместо номера карты записывается зашифрованная последовательность символов. В таком случае номер карты силами этой базы данных никак восстановить нельзя. Поэтому перед анализом необходимо исключить некорректные данных. 

Основные поля для анализа:

  • datetime — дата и время совершения транзакции

  • card — номер бонусной карты

  • summ_with_disc — сумма чека с учетом скидок и списаний бонусов

    Начинаем анализ

    Пошаговый план анализа:

    1. Анализ структуры датасета и его обработка;

    2. Расчет метрик recency, frequency, monetary;

    3. Анализ результатов метрик и присвоение ранга клиентам;

    4. Анализ полученных результатов и формирование рекомендаций.

    Анализ структуры датасета и его обработка

    Как уже говорилось ранее в базе данных есть потерянные данные, которые необходимо исключить из анализа.  

    Расчет метрик recency, frequency, monetary

    Для расчета давности покупки необходимо было определить для каждого пользователя дату его последней покупки. Далее необходимо было определить дату самой последней покупки в аптеке и от нее отнять последнюю дату для каждого клиента. Дни будут отображать как давно клиент производил покупку. Эти данные дальше будут использоваться для присвоения ранга клиента.

    Расчет частоты покупки производится на основании количества появлений в датасете поля card.

    Сумма покупки рассчитывается по полю summ_with_disc.

Обязательно для Обязательно для себя проговаривайте, по каким полям и каким принципам вы будете проводить расчёты. Это поможет чётко представлять, с какими данными мы имеем дело и как с ними работать.

Анализ результатов метрик и присвоение ранга клиентам

Основная сложность — определить границы сегментов, потому что универсальных рекомендаций по этому поводу нет.

Для решения поставленной задачи для каждой метрики, были подсчитаны средние, медианы и перцентили. Далее на основании полученных данных принимается решение о установки порогов для определения рангов.

Ниже будут представлены статистические графики по каждому из факторов. Графики можно сделать в любой BI системе, в данном случае — Metabase.

Статистические графики:

Распределение давности покупок

Распределение давности покупок

Распределение кол-во покупок

Распределение кол-во покупок

Распределение суммы покупок

Распределение суммы покупок

Далее необходимо проанализировать каждый показатель и сделать определенные выводы. Например, если средний и медианный показатели имеют большую разницу, то это может свидетельствовать о том, что есть выбросы. Дело в том, что среднее — очень чувствительный показатель к выбросам и не отображает реальное положение дел, а медиана, наоборот, показывает центральное значение в выборке. В базе имеется значительная часть клиентов, которая сильно выбивается из распределения всех данных, что искажает нам картину. Для оценки ситуации было принято решение разбить массив данных на децили и построить бар-чарт.

После проведения данных манипуляций необходимо составить таблицу в которой будут отображены пороги вхождения пользователя в тот или иной сегмент. Могу дать несколько советов. Обязательно обратите внимание на выбросы, сравните медиану и среднее. Возможно, следует использовать правило Парето (20% усилий приносит 80% результата). Скажу так, в каждом бизнесе будут свои нюансы определения сегментов. Взгляните на данные под разным углом и обязательно вникните в специфику рассматриваемого бизнеса. В моём случае данные распределились следующим образом.

Итоговая таблица 

Ранг

Recency

Frequency

Monetary

1

41 и менее дней назад

более 5 покупок

4078 р. и более

2

122 и менее дней назад

2–4 покупки

от 1103 р. до 4078 р.

3

более 122 дней

1 покупка

менее 1103 р.

Выделение сегментов

В итоге получается 27 сегментов, но есть одно но… Некоторые группы имею уж совсем мало клиентов. Например, сегмент 313 (давние частые с низким чеком) составляет всего 6 человек и логично было бы объединить их с похожей группой, чтобы не возникало путаницы. Продумывать отдельно к таким сегментам маркетинговую программу очень затратно и вряд ли она будет как-то сильно отличаться от смежной группы. Поэтому клиенты были объединены в 7 логических групп.

4d73d58c24580d78b0fb55debc186d3e.png

Чаще всего нет смысла оставлять все 27 сегментов, а объединить их по некоторым схожим параметрам. Но будьте аккуратны. Не следует объединять спящих потенциальных и спящих менее потенциальных. Ведь в будущем для каждой группы будут выдвигаться специальные условия для повышения их значимости.

Анализ полученных результатов и формирование рекомендаций

Можно выделить несколько основных графиков для визуализации:

  1. Выручка

  2. Средний чек в день

  3. Средняя частота покупок в день

  4. Таблица по каждому клиенту

  5. Кол-во клиентов (динамика)

  6. Выручка (динамика)

  7. Покупки (динамика) и т. д.

Несколько примеров графиков

Обязательно настройте фильтры (время, группы и т. д.)

a8fe0306998dbd16445b52f0d57e7d00.png

7a35167d73cb8d5d5d290a50c2b3123e.png

8e3a93bc54951d261c9d4a0fbec14aff.png

В результате проведенного RFM анализа клинской базы аптечной сети было определено 27 групп которые в последующем были объединены в 7 логические группы.

Основная задача анализа была проанализировать поведение клиентов и сформировать определенные рекомендации по смс-рассылкам. Это позволит подстроиться под каждого клиента и даст возможность сделать уникальные  предложения в зависимости от группы. Фокус стоит сделать на повышение чека и удержанию клиента.

Предложения для групп:

  1. Потенциальные

Мало платежеспособные клиенты, но очень частые и приходили совсем недавно. Основная цель повысить чек данных покупателей. Можно предложить выгодные пары товаров («набор из 3 продуктов по выгодной цене»). Можно предложить хорошую скидку на второй товар в корзине. При оформлении или покупки заказа можно предложить дополнительный товар на скидке. Также можно консультировать по премиальному товару (более дорогому, но с расширенными функциями). Разработать уникальную систему скидок и бонусов, которая побуждает клиентов покупать больше товаров.

Данные действия позволят повысить интерес покупателей к покупке товаров, а соответственно повысить покупательскую способность.

  1. Менее потенциальные 

Здесь ситуация кардинально противоположная. Пользователи аптечной сети мало того что покупали на низкий чек, так они и редкие гости. Но не стоит их списывать со счетов. Для повышения чека можно воспользоваться предложениями выше, а для повышения интереса следует предпринять дополнительные меры. Необходимо как бы напомнить о себе и предложить специальные предложения или интересную информацию о товарах. Также можно продумать систему бонусов которые могут сгореть и напоминать об этом клиентам. На основании истории покупок можно присылать уведомления с интересными предложениями по некоторым видам товара.

  1. Потеряшки (потенциальные)

Это слегка «потерявшиеся» клиенты которые раньше активно пользовались услугами данной аптечной сети. В данной группе есть нюанс… Возможно люди могли сменить место жительство или номер телефона, но не все так однозначно. Они просто могли уйти к конкурентам потому что там лучше ассортимент и тд. Следует проанализировать перечень предлагаемых товаров возможно у вас дефицит определенной группы. Основная цель это показать что компания заметила их отсутствие и предложить уникальное предложение. Если есть возможность проанализировать конкурентов (например у них удобнее способ получения товара или есть предварительная бронь и тд.) и постепенно внедрить в свою политику не забыв уведомить ваших «потеряшек». Возможно клиенты ушли после каких-то изменений в компании которые возможно ухудшили сервис. Таких клиентов не много, но не следует их списывать со счетов.

  1. Чемпионы

Для VIP-клиентов необходимо создать специальные условия. Пластиковая карта с преимуществами, действующими на постоянной основе, станет знаком нашего уважения. Также следует разработать специальную реферальную программу, где они могут получить дополнительные бонусы за приглашение своих друзей и знакомых в компанию.

  1. Лояльные постоянные 

Мы рассматриваем этих клиентов как наших «лидеров» и видим потенциал для их перехода в VIP сегмент  Можно предлагать клиентам специальные акции, скидки и бонусы, которые недоступны другим клиентам и акцентировать на этом внимание. Следует добавить слова благодарности за их активное пользование это позволит ещё ближе расположить клиентов. Также можно ознакомить с преимуществами статуса VIP клиента для стимуляции перехода на другой «уровень». Но следует быть осторожным и не спамить чтобы не отбить желание к покупкам.

  1. Спящие (менее потенциальные)

Таким покупателей к сожалению больше всего… Это разовые пользователи с низким чеком. Для них потребуется самый большой бюджет, а результат может быть не совсем хороший. Следует очень тщательно подбирать программу компанию смс-рассылок, чтобы это было максимально эффективно. 

Возможно клиент мало знает о вашей сети и необходимо уведомить его о преимуществах и услугах которые вы можете предоставить.

Следует также предложить какие-то скидки на товары как для потенциальных клиентов. Это позволить поднять мотивацию прийти в вашу аптеку.

Если клиенты мало знал о вашей компании, но после ознакомления решил использовать ваше приложение или что-то подобное, то можно предложить какие-то приветственные бонусы.

  1. Спящие (потенциальные)

Это группа клиентов которые хорошо покупали, но что-то все реже и реже стали заходить. К данной группе клиентов можно предложить стандартные предложения о скидках и акциях. Следует дать понять их важность и как они ценны для бизнеса. 

Общие выводы 

Стоит аккуратно распоряжаться рекламной кампанией для клиентов, чтобы не оттолкнуть постоянных клиентов и не отодвинуть еще дальше потерявшихся.

Аптечная сеть достаточно специфический бизнес по предоставлению товаров и услуг. Можно использовать рассылки с подкреплением научных статей что позволит понять всю серьезность компании.

Следует произвести также внутреннюю политику компании. Исправить некоторые изъяны из-за которых ушли клиенты. Можно также периодически проводить опросы по качеству предоставляемых услуг и предложения по их улучшению. 

Наш RFM анализ завершен. Важно помнить, что универсального способа анализа клиентов не существует. Необходимо тщательно изучать своих клиентов и предлагать им наилучшие условия. Это значительно повысит эффективность вашего анализа.

© Habrahabr.ru