Articles
Found 5 articles reset the tag Парсинг
Урок 5. Пишем парсер каталога товаров на Scrapy / Python
30 November в 15:47
Всем привет!
Продолжаем серию уроков по разработке парсера на Python.
Сегодня мы перепишем наш парсер с первого урока с использованием фреймворка Scrapy, который позволяет быстро, удобно и качественно создавать серьезные проекты по парсингу, беря на себя значительную часть работы.
В предыдущих уроках: 1) мы написали парсер каталога товаров в файл JSON – видео 2) добавили сохранение результата в Excel-таблицу – видео 3) добавили отправку файлов с результатами в чат Telegram – видео …
Read more →
6,570 0
Урок 4. Пишем Telegram-бота для получения результатов парсинга
23 November в 18:09
Всем привет!
Продолжаем серию уроков по разработке парсера на Python. Сегодня мы создадим небольшого Telegram-бота для получения файлов с результатом последнего парсинга. Предположим, ваш парсер запускается раз в сутки или с другой периодичностью, и вы хотите в любой момент получить актуальную версию выгрузки.
Для написания бота в статье используется библиотека python-telegram-bot. Ссылка на официальный сайт – https://python-telegram-bot.org/.
Среда разработки – PyCharm Community Edition.
В предыдущем уроке мы отправляли по завершении парсинга …
Read more →
13,228 0
Урок 3. Отправка файлов с результатом парсинга в чат Telegram | Парсинг в Telegram
16 November в 16:26
Всем привет!
Продолжаем серию уроков по разработке парсера на Python. Сегодня мы добавим отправку файлов с результатом парсинга в чат Telegram, используя Telegram Bot API.
В предыдущем уроке мы сохраняли результат парсинга товаров с тестового каталога в Excel-таблицу.
Шаг 1. Подготовка
Прежде, чем перейти к работе с Telegram Bot API, нужно создать своего бота через @BotFather. Открываем бота и пишем /start, затем вводим /newbot и выполняем инструкции, заполняя поля. Когда бот …Read more →
5,927 0
Урок 2. Сохраняем результаты парсинга в Excel-таблицу (Python)
9 November в 13:28
Всем привет!
Продолжаем серию уроков по разработке парсера на Python. Сегодня мы добавим сохранение результатов парсинга в Excel-таблицу, используя библиотеку xlsxwriter.
В предыдущем уроке мы собирали товары с тестового каталога с помощью библиотек requests и beautifulsoup4. Результат сохраняли в файл формата JSON, а сегодня добавим и в XLSX.
Библиотеки, используемые в данной статье:
1. xlsxwriter – ссылка на документацию.
По любым возникающим в ходе урока вопросам оставляйте комментарии ниже.
Ссылка на …
Read more →
9,392 0
Урок 1. Пишем парсер каталога товаров на Python
3 November в 22:51
Всем привет! В данном уроке мы займемся разработкой парсера каталога товаров.
Код будем писать на языке программирования Python в среде разработки Python IDLE. В рамках данной статьи не рассматривается установка и настройка последних. Для получения подробной информации вы можете посетить официальный сайт Python.
Собирать данные о товарах будем со специального сервиса на нашем сайте – тестового каталога, где к каждому полю подписан CSS-селектор, по которому можно найти элемент на странице – это нам пригодится в процессе парсинга. Сохранять результат …
Read more →
15,662 1