Skip to content

Latest commit

 

History

History
 
 

3.代码模板

此部分保留代码模板,

聚焦爬虫 Focus_Spider.py 功能是随机搜索的通用爬虫,在代码中指定正则和域名规则,以及随机搜索次数,即可针对该网址采集该网站所有的url, 通过集合进行去重复,完成后写入set,txt文件中.

多进程 SpiderGaoDe-mode.py 该接口随着改版已经失效,接口依旧存在不过是换了位置,主要的代码功能是多进程与数据库都结合,可以适当修改规则即可使用