Skip to content

基于Java语言的网络爬虫,采用Jsoup/Webmagic,可爬取知乎数万条数据。

Notifications You must be signed in to change notification settings

littleNiq/javaspider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

JavaSpider

环境:IDEA + MAVEN

基于Java语言的网络爬虫,采用Jsoup/webMagic,可爬取知乎数万条数据,数据导出到excel表格。

简介

  • 该项目是使用jsoup/webMagic进行爬取知乎各种信息的一个demo集合。
  • 爬虫各种疑难点的解决方案尝试。

功能列表

  • 知乎创造101、偶像练习生两个话题下面的问题抓取。
  • 知乎创造101、偶像练习生两个话题下面的答案抓取。
  • 知乎创造101、偶像练习生两个话题下面的专栏抓取。

About

基于Java语言的网络爬虫,采用Jsoup/Webmagic,可爬取知乎数万条数据。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages