weibo_hot_search_and_comment_crawler

微博热搜爬虫，并且采集热搜新闻下评论的数据，可以弹出弹窗自动输入热搜链接进行评论采集，现在设置是一个热搜下10条新闻，每条新闻20条评论，总共采集10*20=200条评论，还有基于评论生成词云图，排序后把前十高词频的词保存在数据库。

1、运行步骤

1.1 数据库建表

# 新建数据库
CREATE DATABASE weibo CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

1.2 更改数据库配置

hot_search.py第9行

mian.py第37行

1.3 运行 hot_search.py 文件

该文件用来采集所有热搜

1.4 运行 main.py 文件

在输入框输入刚才采集的某个热搜的链接，即可启动爬虫采集该热搜下的10条新闻，及每条新闻下的20条评论

采集结果：

1.5 运行 cipin10.py

该文件用来产生词云图，并把前十词频的词存入数据库

2、后续

后面想采集更多新闻可以修改代码，已写好注释。

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.idea		.idea
img		img
.gitignore		.gitignore
README.md		README.md
cipin10.py		cipin10.py
data.json		data.json
hot_search.py		hot_search.py
main.py		main.py
test1		test1

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

weibo_hot_search_and_comment_crawler

1、运行步骤

1.1 数据库建表

1.2 更改数据库配置

1.3 运行 hot_search.py 文件

1.4 运行 main.py 文件

1.5 运行 cipin10.py

2、后续

About

Releases

Packages

Languages

sorrow233/weibo_hot_search_and_comment_crawler

Folders and files

Latest commit

History

Repository files navigation

weibo_hot_search_and_comment_crawler

1、运行步骤

1.1 数据库建表

1.2 更改数据库配置

1.3 运行 hot_search.py 文件

1.4 运行 main.py 文件

1.5 运行 cipin10.py

2、后续

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages