Skip to content

Latest commit

 

History

History
30 lines (17 loc) · 791 Bytes

README.md

File metadata and controls

30 lines (17 loc) · 791 Bytes

项目名称

gooseeker. 集搜客即时模式网络爬虫项目

项目背景

在python 即时网络爬虫项目启动说明中我们讨论一个数字:程序员浪费在调测内容提取规则上的时间,从而我们发起了这个项目,把程序员从繁琐的调测规则中解放出来,投入到更高端的数据处理工作中。

GooSeeker发布基于xslt的内容提取器,xslt可以通过GooSeeker API获得,让大家能省掉90%的调测正则表达式或者XPath的时间

项目资源

入口页

http://www.gooseeker.com/land/python.html

Python交流园地

http://www.gooseeker.com/doc/forum-59-1.html

知乎专栏

https://zhuanlan.zhihu.com/gooseeker

GooSeeker收割模式网络爬虫

http://www.gooseeker.com