中文竞技场-大模型测评篇

简介: 中文竞技场模型体验

中文竞技场模型体验---写作创作相关
问题一
image.png
问题二
image.png
问题三
image.png
总结:问题1的AB模型回答都是在问题点上的,A给出了好处、坏处和建议等中心内容。但个人B的回答更符合议论文的标准,从A中选取对应应用于B的模式标准会更完美。问题2的回答B模型更系统更规范,条理清晰。问题3的模型都很好的给出了点子,对我来说A的回答更有亮点。
写作创作来说,综上三个问题,模型可以生成诗歌,方案,文章等等,给用户提供了很大的帮助的,具有很好的借鉴意义。

中文竞技场模型体验---知识常识相关

问题一
image.png
问题二
image.png
问题三
image.png
总结:知识常识类是我们生活中最常见的容易碰到的问题。问题1和2的模型的回答都是可以接受的。问题3的我更倾向于B模型,首先他会对你的问题,进行一个总结,以及给出适当的建议,这是比较真诚的回答,会让我产生好感,愿意继续看下去,除了对问题的回答,还有对人的关怀,理解。这是我比较认同的。

中文竞技场模型体验---人类价值观
问题一
image.png

问题二
image.png

问题三
image.png
总结:问题回答的大方向都是对的,阐述的方式不太一样,模型A的回答有理有据会更让人信服。价值观是我们的主观反映。它不仅决定了个人的行为方式,也反映了一个人对于人生、社会、世界的理解和面对一系列人生决策时所采取的态度。价值观并不是一成不变的,跟着社会的发展,知识的学习,都会有不同程度的变化,总得来说保持积极的价值观可以更好的帮助我们处理人生中的各种问题和事情,实现自己的价值。

相关文章
|
人工智能 测试技术 Java
【中文竞技场】大模型深度体验与测评
简介:本次,我深入体验了中文竞技场中的大语言模型,尝试了写作创作、代码编写和中文游戏三个领域,以下是我详细的评测报告。
357 10
【中文竞技场】大模型深度体验与测评
|
数据采集 机器学习/深度学习 人工智能
中文竞技场大模型测评-龙虎榜
本次测评选取写作创作相关、代码相关、知识常识、中文游戏、人类价值观、NLP专业领域6大场景和20个细分维度,分别对通义Qwen-Chat-7B、凤凰Phoenix-7B、ChatGLM2-6B、moss-moon-003-sft等大模型进行了超过 200+ 道题的评测。测评旨在为大家提供有关这些模型在不同领域和维度上的表现,更好地选择适合自己需求的模型和应用,期待这次测评能够为AI模型领域的学习和研究提供有价值的参考和指导。
69996 5
|
搜索推荐 安全 测试技术
中文大模型测评
中文大模型测评
|
数据采集 人工智能
对ModelScope 中的中文竞技场进行分析测评
ModelScope 是一款功能强大的人工智能模型,它在多个领域都有着广泛的应用
|
自然语言处理 Java iOS开发
中文竞技场大模型评测
中文竞技场大模型评测
377 0
|
弹性计算 运维 Serverless
中文竞技场大模型测评
以自身生活经验,测评中文大模型,感受大模型的魅力,为中文大模型的发展贡献一份绵薄之力
1240 2
中文竞技场大模型测评
|
机器学习/深度学习 PyTorch 算法框架/工具
关于Modelscope 中文竞技场测评
Modelscope 是一款用于模型性能测评的开源工具,它提供了一套简便而强大的功能,帮助用户评估和比较不同机器学习模型的性能
382 22
关于Modelscope 中文竞技场测评
中文大模型竞技评测
进行了写作创作、人类价值观、中文游戏3个主题的模型匿名问答测试。
中文大模型竞技评测
对中文竞技场模型的测评
了解并学习了MS大模型,接下来发表一些我的看法。
829 1
对中文竞技场模型的测评

热门文章

最新文章