Skip to content

文章AI伪原创,文章自动生成,NLP,自然语言技术处理

Notifications You must be signed in to change notification settings

IvenWang89/language-ai

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 

Repository files navigation

language-ai

文章AI伪原创,文章自动生成,NLP,自然语言技术处理。项目正在开发中, 请关注核心发行版本发布时间.

关于词库

技术图谱

本项目集成多个NLP优秀项目, 搭配使用。 分词使用百度AI 自然语言处理技术中的词义分析技术, 词义相似度 使用HanLP项目计算同义词距离!

自然语言处理技术(百度AI提供技术支持)

  • 词义分析技术
  • 词向量表示
  • 词义相似度
  • DNN语言模型
  • 依存句法分析
  • 短文本相似度

自然语言处理(hanLP提供技术支持)

HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。

同义词词库

  • 哈工大的同义词词林(扩展版)

技术架构

后端
  • SpringBoot, 简单配置, 快速开发
  • MyBatis , 复杂数据操作
  • Spring Data Jpa , 简单数据操作
  • SwaggerUI BootstrapSwaggerUI, 在线接口文档, 增强美化, 接口文档导出

其他

为什么会使用多个NLP项目, 原因是因为最初是想使用百度AI将整个项目完成。 但由于百度自然语言处理API 对于普通用户调用有次数限制, 超量需要收费, 因此数据量比较大的处理将给了HanLP项目处理。将数据量较小 的分词交给百度AI处理。

  • 关于同义词库文件的位置, 不建议移动和改变, 文件夹以及名字都是。后续有时间, 再优化这个问题吧。

About

文章AI伪原创,文章自动生成,NLP,自然语言技术处理

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Java 96.7%
  • HTML 3.3%