[Перевод] Как я получил пожизненный запас чесночной пиццы с помощью Python и Selenium


Не знаю, как вы, а я обожаю пиццу. Особенно если это особые чесночные пицца-палочки Papa John«s. Поэтому я был в восторге, когда после заказа еды навынос получил от них следующее письмо:

26b46ea9a58f6b0920dc74227ae5bf58.png
Papa John«s © Заголовок письма с опросом

Бесплатная еда! Мне определённо нужно было пройти этот опрос…


66febb619f8d74c3e788799ca37b8343.png
Papa John«s © Завершающая страница опроса

Я завершил опрос как нормальный человек и получил код валидации для бесплатной чесночной пиццы.

Но из любопытства я ещё раз взглянул на ссылку. Похоже, параметр GUID был идентификатором клиента. Угадайте, что произошло, когда я изменил его на что-то случайное? Выскочил совершенно новый опрос с новыми халявными пицца-палочками.

Я мог делать это вечно! Но это не самое эффективное использование моего времени, так что давайте применим немного магии Selenium.


Selenium Webdriver — это фреймворк автоматизации действий в браузере, который в основном используется для тестирования. Я выбрал Python как язык программирования и решил попробовать Selenium для создания опросного бота.

Установка


Для начала запускаем pip install selenium и pip install fake_useragent. Что такое user-agent? Документация MDN определяют его следующим образом:

Заголовок запроса User-Agent — это строка, позволяющая серверам и сетевым узлам идентифицировать приложение, операционную систему, поставщика и/или версию агента, который отправил запрос.


Мне показалось хорошей идеей рандомизировать этот заголовок, чтобы обойти любой возможный механизм фильтрации/блокировки — вот где появляется fake_useragent.

Кроме того, нужно было скачать ChromeDriver, чтобы взаимодействовать с браузером Chrome.


Базовая настройка Selenium выглядит следующим образом (инициализация с помощью случайного user-agent):

from fake_useragent import UserAgent
from selenium import webdriver
from random import randrange
import time

ua = UserAgent(verify_ssl=False)
user_agent = ua.random

print("USER AGENT: " + user_agent)

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("user-agent=" + user_agent)
driver = webdriver.Chrome(chrome_options=chrome_options)


После рандомизации параметра GUID бот открывает веб-страницу и начинает щёлкать мышью. Я добавил секундную задержку между действиями, чтобы страница успевала загружаться и чтобы выглядеть примерно как реальный человек.

id = randrange(100000000000000)
url = "https://www.papajohnsfeedback.com/GBR?GUID=" + str(id)

print(url)

driver.get(url)
time.sleep(1)

driver.find_element_by_id('NextButton').click()
time.sleep(1)

driver.find_element_by_id('NextButton').click()
time.sleep(1)

driver.find_element_by_xpath("//div[contains(@class, 'Opt1')]/span").click()
time.sleep(1)


Часть скрипта бота

XPath


XPath — это язык запросов для выбора узлов из документа HTML или XML. Для каждого из вопросов опроса я использовал инструмент тестирования XPath реального времени для выбора правильных узлов, на которые нажимает бот. Конечно, я ставил Papa John«s оценки 5 звёзд по всем пунктам.

5c8197cc7ee71ecfa67a9538f73e1cc4.png
Тестирование XPath

Всегда пожалуйста!


И, наконец, получаем код валидации.

ee7367c31afb7481200b3b982303c38b.png
Papa John’s © Завершающая страница опроса

driver.find_element_by_id('NextButton').click()
time.sleep(1)

code = driver.find_element_by_class_name('ValCode').get_attribute("innerHTML").split(' ')[2]


Извлечение кода валидации

Празднование


Через полчаса программирования python-бот был готов. Вот gist с кодом, а вот он в действии:
Я ввёл все сгенерированные коды при расчёте в корзине Papa John’s. И вот он — потенциально бесконечный запас чесночных пицца-палочек.

Бесплатная пицца для меня и отличные отзывы для отдела маркетинга Papa John’s. Кажется, беспроигрышная ситуация! Для этого бота мне даже пришлось изучить XPath и отточить свои навыки Selenium.

795608212d2e612577cd6d359fd44308.png

Конечно, я ничего не заказал. Как честный человек, я уведомил Papa John’s об уязвимости вместе с видеодоказательством. На момент написания статьи они не ответили. Но опрос больше не работает, так что я думаю, что они получили сообщение.

Кстати, я мог бы запрограммировать заказ 1000 чесночных пицц из каждого магазина Papa John’s по всей Великобритании и в одиночку повергнуть сеть Papa John’s в безумие. Можете себе представить, какой возник бы хаос?

Возможно, я сделал это в параллельной вселенной.

© Habrahabr.ru