获取丁香园所有医院具体的数据信息(有:三甲、三乙、三丙、三级、二甲、二乙、二丙、二级、一甲、一乙、一丙、一级、未定级),存储的信息:
- 使用了 BeautifulSoup 自动。
- 使用了 time.sleep 的休眠,保证安全,不会出现被封禁的可能。

- 只要在 main.py 运行,就可以保证全自动进行获取数据。
- 获取的数据会自动存储在 Excel 表格中,无需手动去添加。 添加到每个地区的文件中:

- 所有数据 data 都放在 data.py 文件里。
- 主函数为 main.py,运行这里的文件就可以全自动爬取。
- main_all.py 包含主要的执行函数。