文章AI伪原创,文章自动生成,NLP,自然语言技术处理。项目正在开发中, 请关注核心发行版本发布时间.
- 使用到的中文同义词词库是哈工大的同义词词林(扩展版)
- 下载地址:https://www.ltp-cloud.com/download#down_cilin
- 项目自带词库(csdn下载的)
本项目集成多个NLP优秀项目, 搭配使用。 分词使用百度AI 自然语言处理技术中的词义分析技术, 词义相似度 使用HanLP项目计算同义词距离!
- 词义分析技术
- 词向量表示
- 词义相似度
- DNN语言模型
- 依存句法分析
- 短文本相似度
HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。
- 哈工大的同义词词林(扩展版)
- SpringBoot, 简单配置, 快速开发
- MyBatis , 复杂数据操作
- Spring Data Jpa , 简单数据操作
- SwaggerUI BootstrapSwaggerUI, 在线接口文档, 增强美化, 接口文档导出
为什么会使用多个NLP项目, 原因是因为最初是想使用百度AI将整个项目完成。 但由于百度自然语言处理API 对于普通用户调用有次数限制, 超量需要收费, 因此数据量比较大的处理将给了HanLP项目处理。将数据量较小 的分词交给百度AI处理。
- 关于同义词库文件的位置, 不建议移动和改变, 文件夹以及名字都是。后续有时间, 再优化这个问题吧。