舆情线下爬虫设计 安装 scrapy $ scrapy startproject dz_spider $ cd dz_spider $ scrapy genspider baidu www.baicu.com 使用spiderkeeper管理scrapy项目 略 新闻正文提取 Article 模块 (clean/news.py) 新闻主题分类 (clean/关键字提取.py)