Анализ покупательских корзин в ритейле
Задача № 1 для ритейлера — понять, кто конкретно совершает покупки в магазине, изучить поведение покупателей, выделить типичные модели, и с помощью этих знаний влиять на количество и качество покупок.
Решение возможно, используя такие подходы:
- анализ данных из программ лояльности и другие формы изучения персон и поведения покупателей;
- анализ данных о покупках и транзакциях.
Перефразируя второй подход — какие товары покупатель положил в свою корзину?
Анализ покупательских корзин (Market Basket Analysis), это набор аналитических подходов для понимания поведения клиентов, выбора товаров, определения ассоциаций и связей между товарами в каждом чеке, вероятности покупки товаров вместе.
Для анализа используются данные из чеков торговой сети:
- список товаров, которые входят в чек;
- дата покупки;
- время покупки;
- стоимость чека.
Происходит идентификация типичных покупательских корзин и действий, с привязкой к датам, дням недели, времени покупок, стоимости чеков.
Ритейлер, используя эту информацию, отвечает на многие вопросы, например:
- Что покупают в пятницу вечером?
- Какие типичные корзины бывают субботним утром?
- С чем покупают крепкий алкоголь?
- Какие товары попадают в корзины от 200 грн.?
- Какие бренды входят в чеки с вермутами Martini?
Существует большой выбор алгоритмов для анализа корзин, из основных мы выделяем Apriori, Eclat, FP-growth. Детальнее на анализе возможностей и различии алгоритмов мы остановимся в следующих публикациях.
Каждый из алгоритмов из всей совокупности чеков выделяет ассоциативные правила (association rules) — повторяющиеся связи между товарами в корзинах.
При анализе корзин покупателей и определения взаимосвязей между товарами ассоциативные правила звучат так:
“Если покупатель покупает товар Х, то с определенной вероятностью он купит товар Y”.
Исходные данные для ассоциативного правила:
Х и Y — 2 товара, категории или товарные группы.
X — определяется, как ключевой товар, причина;
Y — сопровождающий товар, следствие.
Для примера использования Ассоциативных правил возьмем 10 чеков с такими 4 товарами: Молоко, Хлеб, Рыба, Яйца:
- молоко, хлеб;
- хлеб;
- рыба;
- молоко, хлеб, яйца;
- хлеб, яйца, рыба;
- яйца, рыба;
- хлеб;
- молоко, рыба;
- молоко, рыба;
- яйца, рыба.
Используя эти данные примем и рассмотрим правило:
“Если покупают Молоко и Хлеб (Х), то купят и Яйца (Y)”.
Вероятность покупки определяется с помощью таких вычислений:
Поддержка (Support) — высчитывается для одного товара/пары, показывает соотношение количества чеков с выбраным товаром/парой и общего количества чеков.
Сочетание 3 выбраных товаров Молока Хлеба и Яиц у нас в одном чеке, значит:
Support Х = количество чеков с Молоком и Хлебом / общее количество чеков = 2/10 = 0,2
Support Х и Y= количество чеков в которых встречается Х и Y/общее количество чеков = 1/10 = 0,1
Поддержка показывает влияние выбраного правила на все покупки, которые анализируются. Чем больше показатель, тем чаще правило срабатывает для общего массива данных.
Достоверность (Confidence) — показывает соотношение чеков Х и Y к числу чеков в которых покупают только причину — Х.
Т.е. какая вероятность того, что если в корзине покупателя уже лежат Молоко и Хлеб, он купит еще и Яйца.
Confidence = поддержка Х и Y/ поддержка Х = 0,1/0,2 = 0,5
В нашем случае это 50% вероятность, поскольку из двух чеков с Молоком и Хлебом, один содержит еще и Яйца.
При анализе пар товаров также используем коэффициент корреляции. Он определяет, насколько похожа динамика продаж двух товаров.
Возможны 3 варианта корреляции продаж товаров:
- коэффициент корреляции выше 0, позитивная корреляция, графики продаж товаров похожи или идентичны;
- коэффициент корреляции 0 — графики продаж товаров значительно разнятся;
- коэффициент корреляции ниже 0, негативная корреляция, графики продаж товаров противоположны, продажи одного товара растут, второго товара падают.
Анализ покупательских корзин дает информацию о сочетании товаров в типичных корзинах. Но, часто эта информация слишком очевидна или уже известна ритейлеру исходя из его опыта или популярности товаров. Важным в анализе корзин будет определение неявных связей между товарами.
Для этого BI Datawiz.io дает возможность фильтровать покупательские корзины по периодам, дням недели и временным промежуткам. Определять типичные корзины по будням и выходным дням, в разные сезоны, периоды перед праздниками, т.е. целенаправленно структурировать чеки по заданным параметрам.
Фильтрация по стоимости чеков позволяет определить типичные корзины разной ценовой категории, например, какие товары попадают в чеки от 30 до 50 грн., от 500 до 1 тысячи грн.
Еще одним аспектом является анализ покупательских корзин по уровням категоризации.
Категоризация это распределение товаров по разным товарным группам. Например, “Молоко и молочные продукты”, это категория верхнего уровня, она делится на подкатегории — молочные и кисломолочные продукты. Кисломолочные продукты подразделяются на йогурты, кефиры, ряженки и т.п. разных брендов и марок. Нижний уровень категоризации это конкретное наименование товара.
Сервис позволяет анализировать типичные корзины по различным уровням категоризации. Например, на верхнем уровне категоризации покупают Слабоалкогольные напитки с Сигаретами, Снеками и т.д.
Анализ по брендам предоставляет данные вхождение брендов в типичные корзины. Так, покупают пиво “Оболонь” с чипсами “Люкс”, а пиво “Львовское” с “Lays”.
Анализ по наименованиям товаров в типичных корзинах позволяет определить конкретные особенности покупательского поведения. Например, покупка 250г кефира “Молокия” 1,2% и булки с творогом — обед офисной работницы.
Интересные результаты дает анализ по сочетанию конкретных товаров с брендами или категориями. Тут влияют покупательские привычки клиентов, реклама, в какой-то мере даже общественное мнение и традиции.
Сочетание нескольких видов фильтрации при проведении анализа покупательских корзин дает возможность структуризировать нужную ритейлеру информацию о покупках в сети, правильно старгетировать промоактивность, и как результат увеличить прибыль.
На вхождение товаров в корзину влияет расположение товаров в торговом зале, промоакции, наявность товаров на полках и другие факторы.
Это стоит учитывать применяя и используя результаты анализа, чтобы исключить ошибочные данные. Например, товары которые размещены около касc покупают потому что попались на глаза пока человек стоял в очереди, поэтому использовать пары с такими товарами для анализа не логично.
Пример анализа покупательских корзин
Анализировать будем продажи алкоголя в сети супермаркетов с помощью сервиса BI Datawiz.io.
Задача — выявить типичные корзины с алкоголем, определить другие товары в этих корзинах, оптимальное время для продаж определенного вида и брендов алкоголя.
Для анализа алкогольной группы начнем с таких показателей:
Период — текущий год.
Временной промежуток — по времени работы магазина с 8 утра до 23 часов вечера.
Стоимость корзины не ограничена.
Порог — 1 %, отсеивает пары товаров с поддержкой меньше одного процента.
Уровень категоризации для товара-следствия — 0.
Все дни недели.
Как видим, за текущий год чеков с алкоголем было 20458.
На графике отображаются распределение чеков с алкоголем по стоимости с интервалом в 5 грн.:
- по горизонтали — стоимость чеков;
- по вертикали — количество чеков.
Наибольшее количество чеков 1922 — со стоимость 75 гривень.
Основное количество чеков с алкоголем попадает в ценовую категорию от 50 до 200 грн.
Время покупок
В какое время работы магазина покупают больше всего алкоголя?
Проанализируем количество покупок в 3 выбранных временных промежутка:
- с 8 до 13;
- с 13 до 18;
- с 18 до 23.
Утром с 8 до 13 часов в торговой сети — 6153 чека с Алкоголем.
Ценовая категория (как видно на графике) от 50 до 170 грн.
Второй временной промежуток с 13 до 18 часов — 10847 чеков. Ценовая категория от 45-255 гривен.
Послерабочее время с 18 до 23 часов — всего 7173 чека. Ценовая категория — 40-170 грн.
Выводы: казалось бы, крепкий алкоголь должны были бы больше покупать по вечерам после работы, а вот и нет. Максимальное количество покупок — в обеденные часы, в это же время стоимость типичных корзин самая высокая.
Сопутсвующие товары
Сопутсвующие алкоголю товары достаточно предсказуемы. Самые популярные сигареты, пиво, слабоалкогольные напитки, вода.
Попробуем сузить поиск, выставив фильтры на водку “Франківська горілка”, утро субботы.
Использование параметра Уровень категоризации для товара-следствия дает возможность проанализировать пары товаров по разным уровням категорий. Получить информацию какие бренды, категории покупают с конкретным товаром. Для этого надо всего-лишь выставить нужный уровень категоризации.
В данном случае используем третий уровень категоризации и определим какие категории товаров покупают с конкретным брендом водки.
Самые популярные чеки — до 100 грн.
Сопутсвующими товарами к “Франківська горілка” в субботу утром макароны и крупы, пиво, рыбные консервы.
Мы бы назвали эти корзины — “Завтрак холостяка”.
Посмотрим типичные корзины с водкой в субботу и пятницу вечером, сюда входят более дорогие бренды, а в пары к ним другие виды алкоголя, сигареты, кондитерские изделия, сладкая вода и енергетики.
На картинке ниже показаны сочетания из трех товаров в таких типичных корзинах.
Стоимость корзин
Проанализируем чеки от 200 грн. куда входит шампанское.
Как видно на картинке, типичные корзины от 200 грн. с шампанским включают в себя несколько видов алкоголя, т.е. вероятнее всего это покупки на семейные торжества и посиделки.
Хотя пара товаров шампанское и семечки нас ставит в тупик.
Покупки к праздникам
Цикличность покупок к праздникам проще всего проилюстрировать на примере вермутов.
Изначально, вермуты — дамский напиток, и как показывает график его продаж, он еще и напиток праздничный.
В пары с вермутами на третьем уровне категоризации попадают такие товары как дорогие коробки конфет, кондитерские изделия, другой алкоголь, сладкая вода. Опять же, это покупки под застолье.
Для того чтобы проанализировать с какими брендами покупают вермуты используем другие уровни категоризации.
При 5 уровне категоризации получаем результаты как на картинке ниже.
Как видим вермуты покупают с конкретными брендами:
- кондитерских изделий Рошен, Рафаэлло, АВК;
- водкой Зеленый день, Первак, Helsinki;
- сигаретами Parliament, Kent, Marlboro.
Такая информация существенно помогает ритейлеру правильно старгетировать промоактивность.
Что еще интересно, практически любой крепкий алкоголь наш покупатель берет с одним из видов колы.
Кола с крепкими напитками дает высокий показатель корреляции.
Пары товаров и зависимости хорошо видно на графиках продаж.
Синим цветом выделены продажи колы, желтым — продажи алкоголя, красным — продажи пары товаров.
Графики продаж колы и алкоголя схожи. Акции по продаже любого крепкого алкоголя и колы будут всегда успешны.
Как анализ покупательских корзин использует ритейлер?
- Для оптимизации выкладки товаров. Например, размещать парные товары рядом для увеличения вероятности покупки. Или же наоборот, товары вероятность покупки которых велика, на расстоянии друг от друга, а между ними третий нужный товар.
- Для выбора акционных товаров. Хорошая идея промоактивности — перед праздниками давать скидку на дорогие конфеты, например Рафаелло, при покупке вермутов.
- Для целевой маркетинговой активности. Формирование спецпредложений для разных групп клиентов по ключевым и сопутсвующим товарам.
- Для понимания потребностей покупателей в разное время и дни недели, предложения нужного ассортимента.
- Для действий по увеличению количества артикулов в покупательских корзинах и среднего чека.
Анализ покупательских корзин — важная составляющая работы с данными в ритейле. BI Datawiz.io дает возможность максимально полно проанализировать всю доступную информацию о покупках в торговой сети.
А Ваши чеки еще лежат мертвым грузом?