⚠️ Неофициальные скрипты, никаким образом не сзязанные напрямую с hh.ru или их администрацией
Скрипты, которые парсят страницы поисков вакансий и кандидатов по их url
Нужно установить requirements
pip install -r requirements.txt
Нужнен python
Python: 3.7
⚠️ Парсинг в полном режиме требует значительно больше времени
Поверхностный парсинг - парсинг данных, указанных только на странице поиска
Полный парсинг - парсинг данных, указанных на странице самой вакансии/кандидата
python vacancy_parser.py "ссылка_на_поиск_по_вакансиям" режим_парсинга "название_файла_куда_сохраняются_данные"
Режим парсинга:
может быть 1 или 2, где 1 - режим поверхностного парсинга, 2 - режим полного парсинга
Пример:
python vacancy_parser.py "https://hh.ru/search/vacancy?st=searchVacancy&text=%D0%9F%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%81%D1%82&search_field=name&area=2734&salary=¤cy_code=RUR&experience=doesNotMatter&order_by=relevance&search_period=&items_on_page=20&no_magic=true&L_save_area=true" 2 vacancies.txt
Формат сохранения данных указан в верхнем комменте кода
Сохраняется в указанный вами файл: одна вакансия - одна строка
Пока в разработке
Вывод в консоль будет показывать прогресс парсинга