NER
Folders and files
Name | Name | Last commit date | ||
---|---|---|---|---|
parent directory.. | ||||
# 实体识别&词性标注 - ## 微博实体识别. - https://github.com/hltcoe/golden-horse - ## boson数据。 - 包含6种实体类型。 - https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/boson - ## 1998年人民日报数据集。 - 人名、地名、组织名三种实体类型 - [https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/renMinRiBao](https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/renMinRiBao) - ## MSRA微软亚洲研究院数据集。 - 5 万多条中文命名实体识别标注数据(包括地点、机构、人物) - https://github.com/InsaneLife/ChineseNLPCorpus/tree/master/NER/MSRA - SIGHAN Bakeoff 2005:一共有四个数据集,包含繁体中文和简体中文,下面是简体中文分词数据。 - MSR: <http://sighan.cs.uchicago.edu/bakeoff2005/> - PKU :<http://sighan.cs.uchicago.edu/bakeoff2005/>