spider_baike 简单的小爬虫,爬百度百科词条信息。简单的架构帮你快速入门 使用此工具前需了解python基础语法知识 main文件主程序 url_manager url管理器 downloader 下载url中的html内容 html_parse 把内容分析 html_outputer 最后把结果输出 1 使用前需要安装python 以及urllib2、urlparse、re的依赖 2 运行前需设置收个爬去的url链接 root_url