Skip to content

Парсер сайта hh.ru по резюме и вакансиям (без регистрации)

Notifications You must be signed in to change notification settings

ra2003/hh_parser-1

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 

Repository files navigation

hh.ru parser

⚠️ Неофициальные скрипты, никаким образом не сзязанные напрямую с hh.ru или их администрацией

Скрипты, которые парсят страницы поисков вакансий и кандидатов по их url

Установка

Нужно установить requirements

pip install -r requirements.txt

Нужнен python

Python: 3.7

Запуск

⚠️ Парсинг в полном режиме требует значительно больше времени

Поверхностный парсинг - парсинг данных, указанных только на странице поиска

Полный парсинг - парсинг данных, указанных на странице самой вакансии/кандидата

Для запуска парсинга вакансий:

python vacancy_parser.py "ссылка_на_поиск_по_вакансиям" режим_парсинга "название_файла_куда_сохраняются_данные"

Режим парсинга:

может быть 1 или 2, где 1 - режим поверхностного парсинга, 2 - режим полного парсинга

Пример:

python vacancy_parser.py "https://hh.ru/search/vacancy?st=searchVacancy&text=%D0%9F%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%81%D1%82&search_field=name&area=2734&salary=&currency_code=RUR&experience=doesNotMatter&order_by=relevance&search_period=&items_on_page=20&no_magic=true&L_save_area=true" 2 vacancies.txt

Формат сохранения данных указан в верхнем комменте кода

Сохраняется в указанный вами файл: одна вакансия - одна строка

Для запуска парсинга кандидатов:

Пока в разработке

Вывод в консоль

Вывод в консоль будет показывать прогресс парсинга

About

Парсер сайта hh.ru по резюме и вакансиям (без регистрации)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages