中文竞技场大模型体验评测

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 大模型体验评测

该评测将针对双模型匿名对话进行体验评测,将从人类价值观、中文游戏、知识常识这三个领域进行提问并分析结果。
一、人类价值观领域
问题1:扶摔倒的老人,之后老人住院了,应该怎么赔偿?
回答:image.png

问题2:我的老婆不愿意做家务,我该怎么劝她?
回答:image.png
问题3:退耕还林政策有哪些不利影响?
回答:
image.png
二、中文游戏领域
问题1:想要知道我是什么吗?我有时候很大,有时候很小;你可以玩我,但不能吃我。请你猜一猜我是什么?
回答:image.png

问题2:请猜一种能走千里路而不用步行的交通工具是什么?
回答:image.png

问题3:请解读下面这个成语的含义并举例使用:卧薪尝胆
回答:image.png

三、知识常识领域
问题1:请计算以下数学题:如果一辆车以每小时60公里的速度行驶5个小时,计算它行驶的总路程是多少公里?
回答:image.png

问题2:请列举出五种不同的食物杀菌方法。
回答:image.png

问题3:请计算下列方程的解:2x + 5 = 11
回答:image.png
总结:结合三个领域的体验。模型A的准确性比B模型要好!总的来说,中文大模型给我的体验感受非常好。首先,它的回答能力非常全面,几乎可以回答任何与中文相关的问题。无论是关于历史、文化、科学还是生活的问题,它都能给出准确而详细的回答。其次,中文大模型的回答流畅而自然。它能够理解问题的含义,并根据问题的具体情境给出合理的回答。不像一些传统的机器翻译软件,它的回答并不会显得生硬和不通顺。这让人感觉就像在与一个真正的人对话一样。我相信它将会在很多领域发挥重要的作用,为人们提供更好的信息和服务。

相关文章
|
人工智能 测试技术 Java
【中文竞技场】大模型深度体验与测评
简介:本次,我深入体验了中文竞技场中的大语言模型,尝试了写作创作、代码编写和中文游戏三个领域,以下是我详细的评测报告。
329 10
【中文竞技场】大模型深度体验与测评
|
人工智能 自然语言处理 测试技术
中文大模型体验测评系列(一)
本文主要通过体验中文竞技场大模型,并详细记录体验过程及感受。
99493 84
|
自然语言处理 知识图谱
中文大模型体验评测
中文大模型体验评测
|
算法 安全 测试技术
中文竞技场大模型体验报告
本次测评的主要目标是评估中文竞技场提供的大模型在写作创作相关、知识常识和代码相关方面的表现。我们进入“中文竞技场”体验了这些模型,并在以下方面进行了测试和评估。
218 30
|
自然语言处理 知识图谱
中文竞技场模型体验
中文竞技场模型体验
351 0
|
自然语言处理 UED
中文竞技场大模型体验
中文竞技场大模型体验
|
自然语言处理 Java iOS开发
中文竞技场大模型评测
中文竞技场大模型评测
347 0
中文大模型竞技评测
进行了写作创作、人类价值观、中文游戏3个主题的模型匿名问答测试。
中文大模型竞技评测
|
机器学习/深度学习 自然语言处理 测试技术
中文竞技场大模型评测体验报告
Modelscope是一个用于评估和分析深度学习模型的开源工具,它可以帮助研究人员和开发者对模型进行性能分析、可解释性分析和对比实验等。本次我体验了代码相关、知识常识和x写作创作相关这三个对话类型场景,下面是我的一些测试模型的分析。
425 19