Skip to content

A crawler system. Config your spiders, manage it through web.

License

Notifications You must be signed in to change notification settings

Zephor5/zspider

Repository files navigation

ZSPIDER | Documentation Status

一个分布式的定时抓站系统 for English README

Python 版本要求

  • python3.7
  • python3.8
  • python3.9

系统组件

dispatcher

任务分配中心 : 可以在多个服务器上启动,它将自动检测一个工作,其余冷备.

crawler

抓站工作组件 : 实际执行抓取任务

web

web后台 : 系统管理web后台.

三方资源依赖

  • rabbitmq
  • mongodb
  • memcached

使用docker安装更快捷

说明

文档也许有时间会慢慢写

当前项目已经处于基本可用状态。运行前装好资源依赖,修改好配置即可。

注意源文件文件名包含 conf的. 主要是:

  • conf.py
  • crawl_conf.py
  • dispatcher_conf.py
  • web_conf.py

开发工具

dev 工具可以尝试使用.

安装好后在本项目目录执行 dev zspider 查看选项

About

A crawler system. Config your spiders, manage it through web.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages