- Регистрация
- 21.07.20
- Сообщения
- 40.408
- Реакции
- 1
- Репутация
- 0
История голодного студента с пытливым умом
Не знаю, как вы, а я обожаю пиццу. Особенно если это особые чесночные пицца-палочки Papa John’s. Поэтому я был в восторге, когда после заказа еды навынос получил от них следующее письмо:
Papa John’s (с) Заголовок письма с опросом
Бесплатная еда! Мне определённо нужно было пройти этот опрос…
Опрос
Papa John’s (с) Завершающая страница опроса
Я завершил опрос как нормальный человек и получил код валидации для бесплатной чесночной пиццы.
Но из любопытства я ещё раз взглянул на ссылку. Похоже, параметр GUID был идентификатором клиента. Угадайте, что произошло, когда я изменил его на что-то случайное? Выскочил совершенно новый опрос с новыми халявными пицца-палочками.
Я мог делать это вечно! Но это не самое эффективное использование моего времени, так что давайте применим немного магии Selenium.
Бот
Установка
Для начала запускаем pip install selenium и pip install fake_useragent. Что такое user-agent?
Мне показалось хорошей идеей рандомизировать этот заголовок, чтобы обойти любой возможный механизм фильтрации/блокировки — вот где появляется fake_useragent.
Кроме того, нужно было скачать
Код
Базовая настройка Selenium выглядит следующим образом (инициализация с помощью случайного user-agent):
from fake_useragent import UserAgent
from selenium import webdriver
from random import randrange
import time
ua = UserAgent(verify_ssl=False)
user_agent = ua.random
print("USER AGENT: " + user_agent)
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("user-agent=" + user_agent)
driver = webdriver.Chrome(chrome_options=chrome_options)
После рандомизации параметра GUID бот открывает веб-страницу и начинает щёлкать мышью. Я добавил секундную задержку между действиями, чтобы страница успевала загружаться и чтобы выглядеть примерно как реальный человек.
id = randrange(100000000000000)
url = "
print(url)
driver.get(url)
time.sleep(1)
driver.find_element_by_id('NextButton').click()
time.sleep(1)
driver.find_element_by_id('NextButton').click()
time.sleep(1)
driver.find_element_by_xpath("//div[contains(@class, 'Opt1')]/span").click()
time.sleep(1)
Часть скрипта бота
XPath
XPath — это язык запросов для выбора узлов из документа HTML или XML. Для каждого из вопросов опроса я использовал
Тестирование XPath
Всегда пожалуйста!
И, наконец, получаем код валидации.
Papa John's (с) Завершающая страница опроса
driver.find_element_by_id('NextButton').click()
time.sleep(1)
code = driver.find_element_by_class_name('ValCode').get_attribute("innerHTML").split(' ')[2]
Извлечение кода валидации
Празднование
Через полчаса программирования python-бот был готов. Вот
Спасибо, Papa John’s
Я ввёл все сгенерированные коды при расчёте в корзине Papa John's. И вот он — потенциально бесконечный запас чесночных пицца-палочек.
Бесплатная пицца для меня и отличные отзывы для отдела маркетинга Papa John's. Кажется, беспроигрышная ситуация! Для этого бота мне даже пришлось изучить XPath и отточить свои навыки Selenium.
Конечно, я ничего не заказал. Как честный человек, я уведомил Papa John's об уязвимости вместе с видеодоказательством. На момент написания статьи они не ответили. Но опрос больше не работает, так что я думаю, что они получили сообщение.
Кстати, я мог бы запрограммировать заказ 1000 чесночных пицц из каждого магазина Papa John's по всей Великобритании и в одиночку повергнуть сеть Papa John's в безумие. Можете себе представить, какой возник бы хаос?
Возможно, я сделал это в параллельной вселенной.
Не знаю, как вы, а я обожаю пиццу. Особенно если это особые чесночные пицца-палочки Papa John’s. Поэтому я был в восторге, когда после заказа еды навынос получил от них следующее письмо:
Papa John’s (с) Заголовок письма с опросом
Бесплатная еда! Мне определённо нужно было пройти этот опрос…
Опрос
Papa John’s (с) Завершающая страница опроса
Я завершил опрос как нормальный человек и получил код валидации для бесплатной чесночной пиццы.
Но из любопытства я ещё раз взглянул на ссылку. Похоже, параметр GUID был идентификатором клиента. Угадайте, что произошло, когда я изменил его на что-то случайное? Выскочил совершенно новый опрос с новыми халявными пицца-палочками.
Я мог делать это вечно! Но это не самое эффективное использование моего времени, так что давайте применим немного магии Selenium.
Бот
You must be registered for see links
— это фреймворк автоматизации действий в браузере, который в основном используется для тестирования. Я выбрал Python как язык программирования и решил попробовать Selenium для создания опросного бота.Установка
Для начала запускаем pip install selenium и pip install fake_useragent. Что такое user-agent?
You must be registered for see links
определяют его следующим образом:Заголовок запроса User-Agent — это строка, позволяющая серверам и сетевым узлам идентифицировать приложение, операционную систему, поставщика и/или версию агента, который отправил запрос.
Мне показалось хорошей идеей рандомизировать этот заголовок, чтобы обойти любой возможный механизм фильтрации/блокировки — вот где появляется fake_useragent.
Кроме того, нужно было скачать
You must be registered for see links
, чтобы взаимодействовать с браузером Chrome.Код
Базовая настройка Selenium выглядит следующим образом (инициализация с помощью случайного user-agent):
from fake_useragent import UserAgent
from selenium import webdriver
from random import randrange
import time
ua = UserAgent(verify_ssl=False)
user_agent = ua.random
print("USER AGENT: " + user_agent)
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("user-agent=" + user_agent)
driver = webdriver.Chrome(chrome_options=chrome_options)
После рандомизации параметра GUID бот открывает веб-страницу и начинает щёлкать мышью. Я добавил секундную задержку между действиями, чтобы страница успевала загружаться и чтобы выглядеть примерно как реальный человек.
id = randrange(100000000000000)
url = "
You must be registered for see links
" + str(id)print(url)
driver.get(url)
time.sleep(1)
driver.find_element_by_id('NextButton').click()
time.sleep(1)
driver.find_element_by_id('NextButton').click()
time.sleep(1)
driver.find_element_by_xpath("//div[contains(@class, 'Opt1')]/span").click()
time.sleep(1)
Часть скрипта бота
XPath
XPath — это язык запросов для выбора узлов из документа HTML или XML. Для каждого из вопросов опроса я использовал
You must be registered for see links
тестирования XPath реального времени для выбора правильных узлов, на которые нажимает бот. Конечно, я ставил Papa John’s оценки 5 звёзд по всем пунктам.Тестирование XPath
Всегда пожалуйста!
И, наконец, получаем код валидации.
Papa John's (с) Завершающая страница опроса
driver.find_element_by_id('NextButton').click()
time.sleep(1)
code = driver.find_element_by_class_name('ValCode').get_attribute("innerHTML").split(' ')[2]
Извлечение кода валидации
Празднование
Через полчаса программирования python-бот был готов. Вот
You must be registered for see links
с кодом, а вот он в действии:Спасибо, Papa John’s
Я ввёл все сгенерированные коды при расчёте в корзине Papa John's. И вот он — потенциально бесконечный запас чесночных пицца-палочек.
Бесплатная пицца для меня и отличные отзывы для отдела маркетинга Papa John's. Кажется, беспроигрышная ситуация! Для этого бота мне даже пришлось изучить XPath и отточить свои навыки Selenium.
Конечно, я ничего не заказал. Как честный человек, я уведомил Papa John's об уязвимости вместе с видеодоказательством. На момент написания статьи они не ответили. Но опрос больше не работает, так что я думаю, что они получили сообщение.
Кстати, я мог бы запрограммировать заказ 1000 чесночных пицц из каждого магазина Papa John's по всей Великобритании и в одиночку повергнуть сеть Papa John's в безумие. Можете себе представить, какой возник бы хаос?
Возможно, я сделал это в параллельной вселенной.