一个分布式的定时抓站系统 for English README
- python3.7
- python3.8
- python3.9
任务分配中心 : 可以在多个服务器上启动,它将自动检测一个工作,其余冷备.
抓站工作组件 : 实际执行抓取任务
web后台 : 系统管理web后台.
- rabbitmq
- mongodb
- memcached
使用docker安装更快捷
文档也许有时间会慢慢写
当前项目已经处于基本可用状态。运行前装好资源依赖,修改好配置即可。
注意源文件文件名包含 conf
的. 主要是:
conf.py
crawl_conf.py
dispatcher_conf.py
web_conf.py
dev 工具可以尝试使用.
安装好后在本项目目录执行 dev zspider
查看选项