Скрепинг / парсинг
Что это?
- Скрепинг / парсинг - когда стягиваем инфу с сайта
- 2 подхода:
- Скрепинг простых статических сайтов (где не надо ждать пока подгрузится js)
- Просто делается http-запрос и парсится html
- beatifulsoup / requests-html
- Скрепинг сложных сайтов (напр. с авторизацией)
- Используется browser-driver (web-driver) - прога, которая запускает браузер, которым можно управлять из кода
- Selenium (web-driver) / helium
- Скрепинг простых статических сайтов (где не надо ждать пока подгрузится js)
Что может пойти не так
- Гугл-авторизация может не работать в стандартном selenium-web-driver
- Так что юзаем https://github.com/ultrafunkamsterdam/undetected-chromedriver