Skip to content

爬虫,全国医院数据库!!!,数据来源:丁香园

Notifications You must be signed in to change notification settings

josk3/Hospital_data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

医院数据的获取,数据来源:丁香园

python + BeautifulSoup 实现

license

介绍

获取丁香园所有医院具体的数据信息(有:三甲、三乙、三丙、三级、二甲、二乙、二丙、二级、一甲、一乙、一丙、一级、未定级),存储的信息: image

特点

  1. 使用了 BeautifulSoup 自动。
  2. 使用了 time.sleep 的休眠,保证安全,不会出现被封禁的可能。
image
  1. 只要在 main.py 运行,就可以保证全自动进行获取数据。
  2. 获取的数据会自动存储在 Excel 表格中,无需手动去添加。 添加到每个地区的文件中:
image

每个地区文件对应每个等级类型的医院: image

具体的(三甲): image

代码介绍

  1. 所有数据 data 都放在 data.py 文件里。
  2. 主函数为 main.py,运行这里的文件就可以全自动爬取。
  3. main_all.py 包含主要的执行函数。

About

爬虫,全国医院数据库!!!,数据来源:丁香园

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages