测试技术

首页 标签 测试技术
# 测试技术 #
关注
73351内容
5月前
|
如何看待国内AI大模型高考数学成绩超GPT-4o?
近日,复旦NLP实验室的LLMEVAL团队推出2024高考数学真题的系列评测,13个大模型“考生”参加。根据两次评测的结果发现,两次排名通义千问Qwen2-72b均超过GPT-4o。如何看待这一结果?
免费试用