Skip to content

ase77/bs4_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Парсер Python

Описание:

Парсер имеет 4 режима работы (аргументы командной строки можно посмотреть введя в терминале из дериктории src/ команду python main.py --help):

whats-new:

  • Собирает важные изменения между основными версиями Python
  • Соберает ссылки на статьи о нововведениях
  • Достаёт из статей справочную информацию (имя автора или редактора статьи)
  • Сохраняет результат в табличном виде в csv-файл или выводит в терминал

latest-versions:

  • Собирает информацию о версиях Python
  • Находит номера, статусы и ссылки на документацию
  • Сохраняет результат в табличном виде в csv-файл или выводит в терминал

download:

  • Скачивает архив с документацией на актуальную версию Python

pep:

  • Собирает данные обо всех документах PEP
  • Сравнивает статус на странице PEP со статусом в общем списке
  • Считает количество PEP в каждом статусе и общее количество PEP
  • Сохраняет результат в табличном виде в csv-файл или выводит в терминал

Используемые технологии:

Python, BeautifulSoup, PrettyTable, tqdm, logging

Как запустить проект:

Клонировать репозиторий и перейти в него в командной строке:

git clone [email protected]:ase77/bs4_parser_pep.git

cd bs4_parser_pep/src

Cоздать и активировать виртуальное окружение:

  • Если у вас Linux/MacOS

    python3 -m venv venv
    source venv/bin/activate
    
  • Если у вас Windows

    python -m venv venv
    source venv/Scripts/activate
    

Установить зависимости из файла requirements.txt:

python3 -m pip install --upgrade pip
pip install -r requirements.txt

Запуск парсера:

Перейти в дерикторию cd bs4_parser_pep/src

Ввести в командной строке python main.py + обязательный позиционный аргумент и при необходимости, необязательный опциональный аргумент, например:

python main.py whats-new -o pretty

Аргументы командной строки:

positional arguments:
  {whats-new,latest-versions,download,pep}
                        Режимы работы парсера

optional arguments:
  -h, --help            show this help message and exit
  -c, --clear-cache     Очистка кеша
  -o {pretty,file}, --output {pretty,file}
                        Дополнительные способы вывода данных

Автор проекта:

Моторин А.В.

В начало ☝️