- [2023.08.10] OpenCompass 现已适配 LMDeploy. 请参考 评测指南 对 Turbomind 加速后的模型进行评估.
- [2023.08.10] Qwen-7B 和 XVERSE-13B的评测结果已更新在 OpenCompass 大语言模型评测榜单!
- [2023.08.09] 更新更多评测数据集(CMMLU, TydiQA, SQuAD2.0, DROP) ,请登录 大语言模型评测榜单 查看更多结果! 欢迎添加你的评测数据集到OpenCompass.
- [2023.08.07] 新增了 MMBench 评测脚本 以支持用户自行获取 MMBench-dev 的测试结果.
- [2023.08.05] GPT-4 的评测结果已更新在 OpenCompass 大语言模型评测榜单!
- [2023.07.27] 新增了 CMMLU! 欢迎更多的数据集加入 OpenCompass.