音译任务通常在使用不同字母和声音系统的语言之间翻译专有名词和技术术语。
输入:
约翰伍兹 (yue han wu zi)
输出:
John Woods
- Word Accuracy in Top-1 (ACC)
- Fuzziness in Top-1 (Mean F-score)
- Mean Reciprocal Rank (MRR)
- MAP measures precision
Named Entity Workshop (NEWS)长期组织音译任务的评测,其中中文/英文是NEWS中参与度最广的子任务之一。NEWS 2018 相关信息:
Test set name | Source | Target | Test set size (phrase pairs) |
---|---|---|---|
NEWS 2018 Dataset_03 T-EnCh | English | Chinese | 1000 |
NEWS 2018 Dataset_03 B-ChEn | Chinese | English | 1000 |
英文-中文
ACC | F-score | MRR | MAP | |
---|---|---|---|---|
He, Cohen (2020) | 0.299 | 0.6799 | ||
EDI (University of Edinburgh) | 0.304 | 0.6791 | 0.4364 | 0.304 |
中文-英文
ACC | F-score | MRR | MAP | |
---|---|---|---|---|
UALB (University of Alberta) | 0.3 | 0.8 | 0.374 | 0.3 |
EDI (University of Edinburgh) | 0.276 | 0.83 | 0.386 | 0.276 |
- NEWS 2018 提供了英文-中文音译和中文-英文音译任务的训练集和开发集。
Train set name | Source | Target | Train set size (phrase pairs) |
---|---|---|---|
NEWS 2018 Dataset_03 T-EnCh |
English | Chinese | 41318 |
NEWS 2018 Dataset_03 B-ChEn |
Chinese | English | 32002 |
- TRANSLIT: 大规模名称音译资源
建议? 修改? 请发邮件到 [email protected]