Skip to content

Latest commit

 

History

History
 
 

lac

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

LAC 词法分析

本示例展示如何使用LAC Module进行预测。

LAC是中文词法分析模型,可以用于进行中文句子的分词/词性标注/命名实体识别等功能,关于模型的细节参见模型介绍

命令行方式预测

cli_demo.sh给出了使用命令行接口(Command Line Interface)调用Module预测的示例脚本, 通过以下命令试验下效果。

$ hub run lac --input_text "今天是个好日子"
$ hub run lac --input_file test.txt --user_dict user.dict

test.txt 存放待分词文本, 如:

今天是个好日子  
今天天气晴朗

user.dict为用户自定义词典,可以不指定,当指定自定义词典时,可以干预默认分词结果。 词典包含三列,第一列为单词,第二列为单词词性,第三列为单词词频,以水平制表符\t分隔。词频越高的单词,对分词结果影响越大,词典样例如下:

天气预报        n       400000  
经      v       1000  
常      d       1000  

NOTE:

  • 该PaddleHub Module使用词典干预功能时,依赖于第三方库pyahocorasick,请自行安装;
  • 请不要直接复制示例文本使用,复制后的格式可能存在问题;

通过Python API预测

lac_demo.py给出了使用python API调用PaddleHub LAC Module预测的示例代码, 通过以下命令试验下效果。

python lac_demo.py