中文竞技场大模型评测

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 中文竞技场大模型评测、知识常识、中文游戏、写作创作。

以下问题基于写作创作相关

1.请以以下开头写一篇未完成的故事:当夜幕降临,一阵诡异的风吹过小镇,引发了一系列奇怪的事件。这时,一个神秘而动人的人物突然出现在镇上……
b08a91652a3b78937007f267a411323.png
故事都进行了相关的续写,相比较来讲模型B故事内容情节更为丰富,较具层次感。对于模型A来讲其写出了故事情节大概内容,且进行人为丰富。
2.假如《三国演义》中,吕布被曹操收为义子可能会发生什么故事
2a2d26910df8972913a488d01cf1cb7.png
对于此问题,模型B发生了报错,模型A基于情况发散的写出了一些较为不错的想法。
3.假如你从2023年穿越回了秦国,你最想做的是什么。
7eb3aeb5d705a74b9c4dbec17c96e77.png
针对这个问题两个模型针对问题特点写出了基于时代特点的不同想法。

以下问题基于中文游戏相关

1.请使用与下面句子相似的句子进行回答:
"这个房间很大,有很多家具和一张舒适的床。"
image.png
针对这个问题模型A给出了一些例句供参考,相对来讲模型B可能理解错了问题的含义只进行了简单的拷贝。
2.请使用你的语言才智解读以下谚语:水能载舟,亦能覆舟。
image.png
针对这个问题两个模型给出了不错的看法,可见在对于中文内容上的谚语解读,具有不错的参考价值

3.请使用中国文化的智慧和洞察力,解读以下谚语并提供详细解释:'守株待兔'

image.png

针对这个问题对于模型A的说法,个人认为它并没有理解问题。对于模型B来讲,其做出了很不错的解释。值得参考

以下问题基于知识常识相关

1.我最近搬到一个新的房子里,我需要一些有用的生活用品。请向我推荐一些高品质的生活产品,比如厨房用具、清洁用品和家具。请提供一些具体的建议和说明,帮助我选择适合我新房子的产品。谢谢!
image.png
针对这个问题,两个模型都在不同的角度给出了不错的答案,针对A模型,其详细的到了品牌推荐。针对B模型,通过涉及到的各个方面,给出了参考建议。因此在实际生活中模型建议不失为一个很不错的参考选择。
2.推荐几个国产品牌并说明其特点
image.png
针对这个问题,两个模型首先很不错的讲出了国产的几个品牌,随后又针对各品牌的不同特点进行了讲解,让人可以很清楚的知道品牌的侧重点。
3.如何乘坐火车
image.png
针对这个问题,两个模型讲出了乘坐火车的注意事项和流程,在往后针对这类模型,对于百科解答方面确实是不错的发展方向

中文竞技场大模型评测总结

通过对中文竞技场大模型中的知识常识、中文游戏、写作创作三个方面的简单方面评测,可以发现模型在知识常识方面,表现十分不错。针对提出的三个问题做出了相对满意的解答。可以满足对知识常识方面应用场景的需求。对于其在写作创作方面可以发现不同模型具有不同的侧重点,有些侧重于创作的层次内容,有些侧重于创作的骨干,彼此之间相互结合可以在实际需求中,提供一定的参考价值和创作灵感。最后对于中文游戏方面,模型间可以基于不同角度给出不同的解答,对于看官来讲激发不同的想法。

目录
相关文章
|
数据采集 机器学习/深度学习 人工智能
中文竞技场大模型测评-龙虎榜
本次测评选取写作创作相关、代码相关、知识常识、中文游戏、人类价值观、NLP专业领域6大场景和20个细分维度,分别对通义Qwen-Chat-7B、凤凰Phoenix-7B、ChatGLM2-6B、moss-moon-003-sft等大模型进行了超过 200+ 道题的评测。测评旨在为大家提供有关这些模型在不同领域和维度上的表现,更好地选择适合自己需求的模型和应用,期待这次测评能够为AI模型领域的学习和研究提供有价值的参考和指导。
69971 5
|
2月前
|
自然语言处理 C语言 Python
中文竞技场大模型评测
介绍“中文竞技场”,一个体验大型中文语言模型的平台。点击进入后,遵循规则输入问题,两个模型将生成回复供对比。避免简单问候,可进行多轮对话,涉及写作、代码、知识、游戏、价值观及NLP等领域。评测示例包括诸葛亮空城计描述、C语言冒泡排序及人生意义探讨等,展示不同模型的风格与优劣。
73 7
|
自然语言处理 知识图谱
中文大模型体验评测
中文大模型体验评测
498 42
|
自然语言处理 Python
中文大模型评测
中文大模型评测
799 3
|
自然语言处理
|
自然语言处理 Java iOS开发
中文竞技场大模型评测
中文竞技场大模型评测
368 0
|
弹性计算 运维 Serverless
中文竞技场大模型测评
以自身生活经验,测评中文大模型,感受大模型的魅力,为中文大模型的发展贡献一份绵薄之力
1229 2
中文竞技场大模型测评
中文大模型竞技评测
进行了写作创作、人类价值观、中文游戏3个主题的模型匿名问答测试。
中文大模型竞技评测
对中文竞技场模型的测评
了解并学习了MS大模型,接下来发表一些我的看法。
821 1
对中文竞技场模型的测评

热门文章

最新文章