Skip to content

Latest commit

 

History

History
 
 

NER

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
# 实体识别&词性标注

- ## 微博实体识别.

  - https://github.com/hltcoe/golden-horse

- ## boson数据。

  - 包含6种实体类型。
  - https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/boson

- ## 1998年人民日报数据集。

  - 人名、地名、组织名三种实体类型 
  - [https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/renMinRiBao](https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/renMinRiBao) 

- ## MSRA微软亚洲研究院数据集。

  - 5 万多条中文命名实体识别标注数据(包括地点、机构、人物) 
  - https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/MSRA

- SIGHAN Bakeoff 2005:一共有四个数据集,包含繁体中文和简体中文,下面是简体中文分词数据。

  -  MSR: <http://sighan.cs.uchicago.edu/bakeoff2005/>
  -  PKU :<http://sighan.cs.uchicago.edu/bakeoff2005/>