舆情系统搭建

系统总共分为以下几个部分

爬App应用市场评分

chromedriver下载地址:http://chromedriver.storage.googleapis.com/index.html
遇到问题：
1、当爬取Appstore上某个应用的第11的评论数据时，会抛后面这个错误：CustomerReviews RSS page depth is limited to 10
2、爬取七麦数据上的Android应用评论数据，是加密的，如微信：https://api.qimai.cn/andapp/getCommentList?analysis=eEcbVw9UUUBAH1dVTCdYVQlRWBV8WUNEcBMJDlwPAFMGBVMDAHATAQ%3D%3D

将相关数据写入csv文件
对评分内容进行数据清洗

（pandas）评论数据清洗：https://blog.csdn.net/qq_43965708/article/details/110884444

数据分类，将应用市场评分自动生成三个分类的词库，好评/中性/差评

python数据处理——选取csv文件中某几行的数据：https://blog.csdn.net/m0_37876745/article/details/87983308

单词翻译

如果是中文产品的话，将中文翻译成英文
如果是英文产品的话，将英文翻译成中文

对词库采取合适的分词策略
用LSTM训练模型，学习demo:https://github.com/xiaohengdai/SentimentAnalysis
从贴吧、微博等其它渠道自动获取到应用数据
对其它渠道获取的应用数据进行数据清洗

从微博热搜抓取的数据如何做清洗呢？

用模型来对清洗后的数据进行预测，对其进行分类
评价模型，不断迭代

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
common		common
config		config
data		data
util		util
GetDoubanData.py		GetDoubanData.py
GetWeiBoData.py		GetWeiBoData.py
README.md		README.md
chromedriver_91_0_4472		chromedriver_91_0_4472
main.py		main.py
test.py		test.py
test_apple_market.py		test_apple_market.py
test_huawei_app_market.py		test_huawei_app_market.py
test_oppo_app_market.py		test_oppo_app_market.py
test_public_opinion_by_ui_auto.py		test_public_opinion_by_ui_auto.py
test_xiaomi_app_market.py		test_xiaomi_app_market.py
zntest.py		zntest.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

舆情系统搭建

About

Releases

Packages

Languages

xiaohengdai/publicOpinionSystem

Folders and files

Latest commit

History

Repository files navigation

舆情系统搭建

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages