Skip to content

Latest commit

 

History

History
 
 

NLPIR SDK

NLPIR SDK##

NLPIR SDK存放了20种NLPIR语义增强分析平台的组件包:

  • Classify规则分类组件:专家启发式规则分类组件
  • Cluster文本聚类组件:Top K主题的自动聚类算法
  • DeepClassifier深度学校训练文本分类组件:
  • DocCompare文档比对组件:对两篇文本进行相似度比对
  • DocExtractor命名实体抽取组件:抽取人名、地名、机构名、时间、及各类自定义的信息
  • DocParser文档解析组件(可解析word,wps,excel,powerpoint,pdf,html等各个版本文档,内嵌OCR)
  • HTMLPaser网站正文提取组件
  • JZsearch精准搜索组件
  • JZSearch精准搜索客户端组件
  • KeyExtract关键词提取组件:自动标引各类关键词,包含各类新词
  • KeyScanner九眼智能过滤组件:识别各种变种,实时扫描不良内容
  • NLPIR-ICTCLAS汉语分词标注组件:经典之作
  • NLPIR-TC 繁体分词标注组件
  • NewWordFinder新词发现组件
  • RedupRemover文档去重组件:文档去重工具
  • SentimentAnalysis情感分析组件:情绪分析
  • SentimentNew情感组件:情感分析组件
  • SplitSentence分句组件:支持中英文的自动分句
  • Summary摘要组件:自动抽取式摘要,生成式摘要没有开放
  • TextSimilarity文本相似度组件:支持三种模式(字、词、语义)的文本相似度计算
  • Word2Vector词向量自动生成

##组件包内容介绍##

  • doc:使用说明文档和API文档
  • include:头文件
  • lib:linux32,linux64,win32,win64等不同版本的库
  • projects:开发工程包
  • sample:C#,C++,java等不同语言的案例
  • Data:数据库