精品活动 | 中文竞技场大模型评测召集令-阿里云开发者社区

精品活动 | 中文竞技场大模型评测召集令

2023-08-15 590

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 8月，魔搭社区联合香港中文大学（深圳）、深圳市大数据研究院、阿里云开发者社区、阿里云开发者评测发布中文竞技场大模型评测活动，汇聚了包括Baichuan-13B、ChatGLM2-6B、Qwen-Chat-7B、moss-moon-003-sft、Ziya-LLaMa-13B-v1等十余款开源大模型在中文对话场域同台PK。

8月，魔搭社区联合香港中文大学（深圳）、深圳市大数据研究院、阿里云开发者社区、阿里云开发者评测发布中文竞技场大模型评测活动，汇聚了包括Baichuan-13B、ChatGLM2-6B、Qwen-Chat-7B、moss-moon-003-sft、Ziya-LLaMa-13B-v1等十余款开源大模型在中文对话场域同台PK。

活动提供 iPhone 14pro、Airpods、社区精美周边等限量诚意好礼，诚邀各位大语言模型爱好者们体验、评测投稿，并根据评测投稿质量、人气、速度分别设立奖项。

评测活动细则

活动时间：

2023年8月15日-2023年9月25日

参与对象：

阿里云认证用户

活动入口：

https://developer.aliyun.com/topic/ms2023

具体玩法：

1、体验场景：十余款中文大模型同台竞技

（中文竞技场模型评测平台由魔搭社区提供能力，后文详细介绍玩法）

2、场景评测：写下真实评测，角逐最佳评测

进入【文章发布页面】，写下中文竞技场大模型真实评测，参与投稿位置点击【投稿入口】进行提交评审。

评测一等奖获得者将被评为“中文竞技场大模型最佳评测官”，在重磅奖品基础上，还有机会参观阿里云云谷，与产研团队实地座谈！

3、超级豪礼：发布体验评测，参与角逐赢大奖！

活动期间，依据用户提交顺序及评审要求，为广大开发者提供多款好礼：

一等奖（导师评选产生） 1名

iPhone 14pro / 开发者评测全套周边 / 阿里云社区最佳评测官奖杯

二等奖（导师评选产生） 2名

ModelScope定制周边背包 / Airpods耳机 / 阿里云社区优质评测证书

三等奖（点赞量前20名） 20名

ModelScope / 定制周边T恤

参与奖（发布评测前100名） 100名

30元天猫超市卡

中文竞技场大模型玩法

双模型匿名评测

玩法一：选择系统推荐的prompt提问

第一步：选择对话类型，系统会自动推荐prompt，直接点击发送，即可体验效果;

第二步：根据结果选择模型的效果，A更好，B更好，都很好，都很差，选择后，可以看到匿名的两个模型名称。

玩法二：构建自己的prompt

第一步：选择对话类型，修改或者清空并重写系统推荐的prompt，点击发送，即可体验效果

第二步：根据结果选择模型的效果，A更好，B更好，都很好，都很差，选择后，可以看到匿名的两个模型名称。

模型自动对话

模型自动对话不支持自定义prompt，同时中文竞技场已经准备好了丰富的多场景prompts，供用户体验。

第一步：选择对话类型，系统会自动推荐prompt，直接点击发送，即可体验效果

第二步：根据A模型和B模型的对话效果，选出效果更好的模型

此时模型会模拟一个场景，并展开场景下的两人的对话。

单模型对话

可选择任意的模型测试效果。目前支持14个主流的中文LLM

点击链接投稿