Skip to content

liangxun/DataMining

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

29 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

北邮计算机研一《数据挖掘》文本分类实验


数据集

从知网爬取了100W篇文章摘要
共10个类,每一类10W条数据

分类算法

NaiveBayes (numpy实现)
SVM (sklearn实现)


files description

  • CNKI/ 爬虫部分,使用scrapy框架
  • data/ 原始数据,bow,tf_idf, 模型参数等
  • notebook/report.ipynb 实验报告,测试集结果

About

北邮《数据挖掘》课程项目

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published