中文竞技场大模型评测

2023-08-15 189

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

交互式建模 PAI-DSW，每月250计算时 3个月

模型训练 PAI-DLC，5000CU*H 3个月

简介： 综合来看，中文竞技场的模型在多个领域中都表现出了能力，不仅能够处理复杂的语言任务，还能够提供有关信息和应用的知识。

一、代码能力评测

1、使用任意编程语言实现一个函数，该函数接收一个整数作为输入，然后返回该整数的阶乘。请确保你的函数可以正确处理输入范围为0到10的整数。

71b608f05984c9174cce89335c5ac8db_qjdn6ii4nizke_1d812f45d2ab448bb71139c42bfcb59f.png

2、设计一个算法，用于统计一段文本中每个单词出现的次数，并按照出现次数降序排列。注意，你的算法应该能够处理大量文本，并保持高效性。请提供一个输入文本以测试你的算法。

776809f15714343e98dc37370299191f_qjdn6ii4nizke_63ed48f1f3ea4223b55719b75b08e1ff.png

3、将以下Python代码翻译成C++：

def factorial(n):
if n == 0:
return 1
else:
return n * factorial(n-1)

6a927a2f87ac8a3fe3cc4bd8c3481507_qjdn6ii4nizke_a1d7a0e12ce84cd3af712f07c65d2068.png

在代码相关领域，我们可以测试模型的编程能力。在这个领域里，模型需要具备一定的编程基础，并且能够理解和执行用户的指令。

正如上面的三词测试，AB模型同时测试，6个问题，2词出错，报错：请求超时，请稍后再试。

先不论结果如何，单单是这个错误率就不合格。
同时，生成的速度也很慢，每个问题都要1分钟才能生成，技术还是差了点。

二、写作能力评测

1、请根据以下材料撰写一篇专题文章，主题为环保。不少于500字。

『随着人口的增长和工业化的加速，环境问题愈发严峻，我们迫切需要采取行动来保护地球。但是，如何有效地实现环保目标仍然是一个亟待解决的难题。你认为环保的重要性和环保行动的作用是什么？请结合实例阐述你的观点。』

2、以下材料是一篇关于人工智能在医疗领域的应用的文章，请根据该文章提供的内容，生成一篇与之相关的摘要。

3、请对以下中文段落进行润色，使其更具表达力和流畅性：

> 在春天的清晨，我走进了一片青山绿水之中。我看到了繁花似锦的景象，听到了鸟儿欢快的歌声。这片美丽的自然风光让我感到宁静和放松。我想要传达这种美好的感受，希望你能帮助我润色这段文字，使其更具韵味和意境。
注意事项：
请不要泄露答案。
请确保润色后的文字表达清晰、生动。
文字可以进行适当的增删改，但不要改变原文的基本意思。
润色后的文字应该更加吸引人，使人能够感受到春天的美好气息。
请以自己的方式润色这段文字，展现你独特的润色能力。
谢谢你的帮助！

整体来看，中文写作的能力要比代码能力稍强一些，但是也是不太满意，内容不相关和出错率还是太大了。

三、知识常识类评测

1、请计算以下多项式的值：(2x^2 + 3x - 5)，其中x的取值范围是-10到10之间的整数。

2、请计算以下数学题：将一根长度为10厘米的细木棒剪成3段，其中一段比另外两段的长度之和多2厘米，问另外两段的长度各是多少？

3、请列举出五种不同的食物杀菌方法。

数学题的计算，问题挺大，模型并没有理解我的意思啊。

同时，“五种”这个词是模型A还不理解吗？只是给出来了1个方法。。

四，整体的评测感想

这个平台让我们有机会深入了解不同领域中的模型效果，包括写作创作、代码相关、知识常识、中文游戏、人类价值观以及NLP专业领域。每个领域都提供了示例提示词，为我们的评测提供了基础。

综合来看，中文竞技场的模型在多个领域中都表现出了能力，不仅能够处理复杂的语言任务，还能够提供有关信息和应用的知识。

然而，我们也注意到，在一些特定的任务中，模型可能需要更多的训练和优化，以提高准确性和自然性。尽管模型在许多方面都表现出色，但在处理一些涉及深度思考、情感理解和创新思维的任务时，仍有一定的提升空间。

中文竞技场大模型评测

一、代码能力评测

二、写作能力评测

三、知识常识类评测

四，整体的评测感想

ModelScope模型即服务

热门文章

最新文章

相关课程

相关电子书

相关实验场景