NLPIR SDK存放了20种NLPIR语义增强分析平台的组件包:
- Classify规则分类组件:专家启发式规则分类组件
- Cluster文本聚类组件:Top K主题的自动聚类算法
- DeepClassifier深度学校训练文本分类组件:
- DocCompare文档比对组件:对两篇文本进行相似度比对
- DocExtractor命名实体抽取组件:抽取人名、地名、机构名、时间、及各类自定义的信息
- DocParser文档解析组件(可解析word,wps,excel,powerpoint,pdf,html等各个版本文档,内嵌OCR)
- HTMLPaser网站正文提取组件
- JZsearch精准搜索组件
- JZSearch精准搜索客户端组件
- KeyExtract关键词提取组件:自动标引各类关键词,包含各类新词
- KeyScanner九眼智能过滤组件:识别各种变种,实时扫描不良内容
- NLPIR-ICTCLAS汉语分词标注组件:经典之作
- NLPIR-TC 繁体分词标注组件
- NewWordFinder新词发现组件
- RedupRemover文档去重组件:文档去重工具
- SentimentAnalysis情感分析组件:情绪分析
- SentimentNew情感组件:情感分析组件
- SplitSentence分句组件:支持中英文的自动分句
- Summary摘要组件:自动抽取式摘要,生成式摘要没有开放
- TextSimilarity文本相似度组件:支持三种模式(字、词、语义)的文本相似度计算
- Word2Vector词向量自动生成
##组件包内容介绍##
- doc:使用说明文档和API文档
- include:头文件
- lib:linux32,linux64,win32,win64等不同版本的库
- projects:开发工程包
- sample:C#,C++,java等不同语言的案例
- Data:数据库