Skip to content

调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。

Notifications You must be signed in to change notification settings

cnzjhdx/Web-crawler

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Web-crawler

基于网络爬虫Scrapy框架及BeautifulSoup模块等爬取数据,基于正则表达式及Xpath进行解析。

调研药品数据网站,基于网络爬虫搭建药品数据库,含中成药和化学药品信息共计10万余条。

爬取国家食品药品监督管理局药品数据对药源网数据进行修正。

基于Selenium等工具应对反爬,爬取ICD-9等数据供研究使用。

About

调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%