Как математика помогает зарабатывать? Лекция для малого ШАДа Яндекса

Яндекс зарабатывает на сайтах сотни миллионов долларов в год, хотя наш поиск — бесплатный. Основной доход мы получаем от рекламы, соединяя продавцов с покупателями. Чтобы делать это хорошо, мы используем сложные алгоритмы, созданные на основе математической статистики, теории вероятностей, машинного обучения, теории игр и теории аукционов. Улучшение алгоритмов всего на несколько процентов — это дополнительные десятки миллионов долларов в год. Из этой лекции вы узнаете, как математика может работать в рекламе.


За что платят рекламодатели?


Существует несколько вариантов оплаты размещения рекламных объявлений в интернете. Самая простая и выгодная модель для рекламной площадки — это CPM (cost-per-mille — оплата за тысячу показов). Она подразумевает, что оплата происходит исключительно за показы объявлений на страницах поисковой выдачи. При этом площадка не отвечает за то, насколько хорошо была таргетирована реклама, понравилась ли она пользователям, и принесла ли какую-нибудь прибыль рекламодателю. Соответственно, для рекламодателя такая модель не очень выгодна, и особой популярностью не пользуется.

Другая модель — CPA (cost-per-action). Она подразумевает, что рекламодатель производит оплату только в случае, если он добился желаемого результат результата, например, продажи товара или услуги.

Для рекламодателя это крайне выгодно, ведь платит он исключительно в случае получения прибыли со своей стороны. У рекламной площадки в рамках этой модели могут возникать некоторые трудности. Ведь даже если реклама была страгетирована правильно, пользователь заинтересовался товаром или услугой и перешел на сайт рекламодателя, вовсе необязательно, что покупка будет совершена сразу. Пользователь может вернуться позже, либо сделать заказ по телефону.

Третья модель — PPC (pay-per-click), оплата за клики. Можно сказать, что это некоторая золотая середина, одинаково выгодная как площадке, так и рекламодателю. Рекламодатель может быть уверен, что его объявления будут демонстрироваться пользователям, которые потенциально могут ими заинтересоваться, а площадка избегает трудностей с фиксацией конверсии. Именно эта модель в основном применяется в Яндексе.

Как отбирать рекламу?


В Яндексе основное таргетирование рекламы производится на основе запроса пользователя. Допустим, пользователь ввел запрос [пластиковые окна в ростове]. При подаче объявления рекламодатели указывают, по каким ключевым словам в запросе они хотели бы его показывать, а по каким — нет. Но даже в этом случае может оказаться, что кандидатов на показ слишком много, из числа которых нужно отобрать наиболее подходящих.

Что лучше показать?


Допустим, у нас на странице выдачи есть одно рекламное место. На основе запроса мы составили список кандидатов на показ и отобрали из них три лучших объявления. Первое демонстрировалось уже 1000 раз, и набрало 100 кликов. Второе показывалось 500 раз и также собрало 100 кликов. А на третье кликнули 300 раз за 10 000 показов. Если мы оценим вероятность кликов, то она составит 10%, 20% и 3% для каждого из объявлений соответственно. Очевидно, что наиболее эффективно по введенному пользователем запросу второе объявление. Т.е. при условии, что все три рекламодателя платят за клик одну и ту же сумму, то показывать второе объявление будет выгоднее всего.

Но ставка за клик может быть разная. Предположим, что первый рекламодатель установил оплату за клик в $0,3, второй $0,1, а третий $2. В этом случае выгодность размещения каждого из объявлений меняется. Умножив вероятность клика на ставку, мы получим следующие суммы: за 1000 показов первого объявления площадка заработает $30, второго $20 и третьего — $60. Соответственно, показ третьего объявления становится более выгодным. Это сильно упрощенная модель, но она позволяет понять, как все и работает.

Сколько списать?


Как же определить, сколько денег брать за клик? Ведь прибыль от него для каждого рекламодателя может быть разной. Наиболее очевидный вариант — устроить аукцион, тогда станет ясно, сколько готовы платить рекламодатели за демонстрацию объявления по запросу с теми или иными ключевыми словами. Однако обычный аукцион, в котором соревнующиеся повышают цену и в итоге, предложивший наибольшую, платит именно ее, из-за некоторых особенностей системы оказывается невыгоден обеим сторонам. Поэтому используется аукцион второй цены, где также выигрывает предложивший наивысшую цену, но платит он столько, сколько предложил предыдущий участник.

Обычно рекламодатель примерно представляет, какую ценность для него составляет каждый клик по объявлению. Если мы примем ценность клика за v, а ставку — за b, то b всегда должно быть меньше или равно v, так как иначе никакой выгоды рекламодателю клик не принесет. Наиболее выгодной стратегией для рекламодателей в таком аукционе является честное выставление значения b равным значению v. Это нетрудно доказать при помощи теории аукционов.

Допустим, за размещение объявления на одном из рекламных мест соревнуются два рекламодателя. Один из них делает ставку b, а второй — ставку b». Цену, которую будет платить в итоге победитель, обозначим как c, и она будет определенно меньше, чем установленное им значение b, т.к. ее значение берется из ставки проигравшего участника. Прибыль победителя (обозначим ее s) можно посчитать по формуле s = p (v — c), где p — это вероятность клика по объявлению при его показе. Теперь докажем, что выгоднее всего устанавливать b равным v. Что ставить b > v рекламодателю невыгодно изначально мы уже определили, так что рассмотрим варианты развития событий при b < v. Если b’ окажется больше v, то участник, поставивший b, проигрывает и никакой прибыли не получает. Возможности выиграть у участника со ставкой b в этом случае просто нет, так как b не может быть больше v.

А если b» меньше v, но больше b, то первый участник снова проигрывает, хотя возможность выиграть у него была, поставь он b равным v. Если же b будет больше b», но меньше v, то все равно будет c равно b», как и если бы b было равно v. Таким образом, при b < v вероятность выиграть аукцион меньше, а итоговая цена в результате выигрыша все равно будет равна b’.

Посмотрев лекцию, вы также узнаете, зачем в таком на первый взгляд простом деле как реклама нужны такие сложные вещи как машинное обучение и распределенные вычисления.

© PCNEWS