Stars
MLSMOTE: Approaching imbalanced multilabel learning through synthetic instance generation
本项目是针对医疗数据,进行命名实体识别。项目中有600份标注好的电子病历文本,共需识别含解剖部位、独立症状、症状描述、手术和药物五类实体。该领域的命名实体识别问题是自然语言处理中经典的序列标注问题。
pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
Hierarchical Clustering Python Implementation