OpenCompass 评测 InternLM-1.8B 实践

August 5, 2024 · View on GitHub

  • 记录复现过程并截图。

基础任务(完成此任务即完成闯关)

  • 使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能,记录复现过程并截图。

进阶任务(闯关不要求完成此任务)

  • 使用 OpenCompass 进行主观评测(选做)
  • 使用 OpenCompass 评测 InternLM2-Chat-1.8B 模型使用 LMDeploy部署后在 ceval 数据集上的性能(选做)
  • 使用 OpenCompass 进行调用API评测(优秀学员必做)

闯关材料提交(完成任务并且提交材料视为闯关成功)