python3
sacrebleu==1.1.7
pip3 install sacrebleu==1.1.7
./test_set/QA10000.q: 通顺问句。
./test_set/QA10000.a: 根据QA10000.q,人工标注回复。
./test_set/Hard1000: 从日志分析的噪声语句中,随机抽取1000条。
./test_set/Hard1000.a1: 人工标注回复1
./test_set/Hard1000.a2: 人工标注回复2
python3 ./scripts/analysis_noise_distribute.py
sh eval.sh
./test_result/Hard1000.labels.xlsx