8月,魔搭社区联合香港中文大学(深圳)、深圳市大数据研究院、阿里云开发者社区、阿里云开发者评测发布中文竞技场大模型评测活动,汇聚了包括Baichuan-13B、ChatGLM2-6B、Qwen-Chat-7B、moss-moon-003-sft、Ziya-LLaMa-13B-v1等十余款开源大模型在中文对话场域同台PK。
活动提供 iPhone 14pro、Airpods、社区精美周边等限量诚意好礼,诚邀各位大语言模型爱好者们体验、评测投稿,并根据评测投稿质量、人气、速度分别设立奖项。
评测活动细则
活动时间:
2023年8月15日-2023年9月25日
参与对象:
阿里云认证用户
活动入口:
https://developer.aliyun.com/topic/ms2023
具体玩法:
1、体验场景:十余款中文大模型同台竞技
(中文竞技场模型评测平台由魔搭社区提供能力,后文详细介绍玩法)
2、场景评测:写下真实评测,角逐最佳评测
进入【文章发布页面】,写下中文竞技场大模型真实评测,参与投稿位置点击【投稿入口】进行提交评审。
评测一等奖获得者将被评为“中文竞技场大模型最佳评测官”,在重磅奖品基础上,还有机会参观阿里云云谷,与产研团队实地座谈!
3、超级豪礼:发布体验评测,参与角逐赢大奖!
活动期间,依据用户提交顺序及评审要求,为广大开发者提供多款好礼:
一等奖(导师评选产生) 1名
iPhone 14pro / 开发者评测全套周边 / 阿里云社区最佳评测官奖杯
二等奖(导师评选产生) 2名
ModelScope定制周边背包 / Airpods耳机 / 阿里云社区优质评测证书
三等奖(点赞量前20名) 20名
ModelScope / 定制周边T恤
参与奖(发布评测前100名) 100名
30元天猫超市卡
中文竞技场大模型玩法
双模型匿名评测
玩法一:选择系统推荐的prompt提问
第一步:选择对话类型,系统会自动推荐prompt,直接点击发送,即可体验效果;
第二步:根据结果选择模型的效果,A更好,B更好,都很好,都很差,选择后,可以看到匿名的两个模型名称。
玩法二:构建自己的prompt
第一步:选择对话类型,修改或者清空并重写系统推荐的prompt,点击发送,即可体验效果
第二步:根据结果选择模型的效果,A更好,B更好,都很好,都很差,选择后,可以看到匿名的两个模型名称。
模型自动对话
模型自动对话不支持自定义prompt,同时中文竞技场已经准备好了丰富的多场景prompts,供用户体验。
第一步:选择对话类型,系统会自动推荐prompt,直接点击发送,即可体验效果
第二步:根据A模型和B模型的对话效果,选出效果更好的模型
此时模型会模拟一个场景,并展开场景下的两人的对话。
单模型对话
可选择任意的模型测试效果。目前支持14个主流的中文LLM
点击链接投稿