「ModelScope」中文竞技场体验测评报告

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 体验大语言模型,并产出创作、代码相关、知识常识三个领域的评测报告

写作创作相关


1. 故事情节生成

  • 问题:请为我编写一个关于爱与勇气的故事情节。
  • 对比:image.png
  • 结论:ModelA(baichuan-13b-chat-v1) 生成的文章更形象生动。

2. 角色对话生成

  • 问题:请为我创造一段有趣的对话场景。
  • 对比:image.png
  • 结论:ModelA(baichuan-13b-chat-v1) 生成的对话更有场面感

    3. 创作建议

  • 问题:你能给我一些建议,帮助我提升写作技巧吗?
  • 对比:image.png
  • 结论:ModelB(chatflow-7b-v1) 给的建议更详细一些。

知识常识相关


1. 历史知识

  • 问题:请问中国的四大发明是什么?
  • 对比:image.png
  • 结论:ModelA(qwen-7b-chat-v1) 会对答案润色。

    2. 科学知识

  • 问题:什么是黑洞?
  • 对比:image.png
  • 结论:ModelB(qwen-7b-chat-v1) 解释的比A更具体一点。

    3. 文化知识

  • 问题:什么是春节?
  • 对比:image.png
  • 结论:ModelA(belle-llama-13b-2m-v1) 和 ModleB(chatglm-6b-v2)差不多

NLP专业领域


1. 机器翻译效果

  • 问题:请将以下英文句子翻译成中文:“I love to travel and explore new cultures.”
  • 对比:image.png
  • 结论:ModelA(ChatPLUG-initial)和 ModelB(ChatPLUG-100Poison)差不多

    2. 语言模型生成

  • 问题:请根据以下提示,使用中文大语言模型生成一个完整的句子:
    • 主题:夏天的海滩
    • 提示:金黄色沙滩、清澈的海水、阳光明媚。
  • 对比:image.png
  • 结论:ModelB(qwen-7b-chat-v1) 生成的句子更生动一些。

    3. 自然语言处理应用

  • 问题:自然语言处理(NLP)有哪些常见的应用领域?
  • 对比:image.png
  • 结论:ModelA(chatglm-6b-v2) 回答的内容更结构化一些。
目录
相关文章
|
19天前
|
自然语言处理 监控 API
"阿里云ModelScope深度测评:从预训练模型到一键部署,揭秘高效模型开发背后的秘密,开发者必备利器!"
【10月更文挑战第23天】阿里云ModelScope是一款便捷的模型开发、训练、部署和应用平台。它提供丰富的预训练模型,涵盖自然语言处理、计算机视觉等领域,支持一键式模型训练和部署,具备模型版本管理和监控功能,显著降低开发门槛,提高模型应用效率。
43 0
|
机器人 测试技术 开发者
ModelScope中文模型测评
Modelscope可以帮助研究人员和开发者对模型进行性能分析等。本次我体验了知识常识,人类价值观和写作创作相关这三个对话类型场景,下面是我对测试模型的分析与看法
328 1
 ModelScope中文模型测评
|
机器学习/深度学习 人工智能 JavaScript
Modelscope 中文竞技场的测评
Modelscope 是一种用于观察和分析模型的工具,它提供了一个直观的界面,使用户能够轻松地浏览和分析模型,而无需深入了解复杂的数学和编程。 以下简单和大家探讨一下Modelscope 中文竞技场的测试分享,将从写作创作相关、代码相关、人类价值观三个方面对进行综合测评,带大家多方面了解这一平台的综合实力。
510 2
|
自然语言处理 程序员 数据库
用Modelscope 中文竞技场的测评体验分享
用Modelscope 中文竞技场的测评体验分享体验了三个场景,分别体验1系统默认的问题提交体验; 2.根据任务问题体验; 3.自主式提问题体验。就系统给出的答案进行评测。
2100 300
|
机器学习/深度学习 人工智能 自然语言处理
ModelScope大模型测评
近年来,随着人工智能技术的不断发展,大模型已经成为了人工智能领域的重要研究方向。大模型是指拥有数百万甚至数十亿个参数的神经网络模型,能够完成许多复杂的任务,如自然语言处理、图像识别等。大模型的出现极大地推动了人工智能技术的发展,也为人类社会带来了巨大的变革。
ModelScope大模型测评
|
机器学习/深度学习 人工智能 自然语言处理
关于Modelscope 中文竞技场的测评体验分享
众所周知,Modelscope 中文竞技场是一款备受关注和期待的智能辅助工具,帮助用户评估和比较不同机器学习模型的性能,它为中文自然语言处理任务提供了一个全新的评测平台。在当今人工智能快速发展的时代背景下,Modelscope 中文竞技场作为一个集写作相关、代码相关和人类价值观于一体的平台,吸引了众多用户的关注。那么接下来就来分享一下Modelscope 中文竞技场的测试分享,将从写作相关、代码相关和人类价值观三个方面对 Modelscope 进行综合测评,带您深入了解这一平台的优势、特点与潜力。
776 1
关于Modelscope 中文竞技场的测评体验分享
|
机器学习/深度学习 自然语言处理 开发者
关于Modelscope 中文竞技场的测评分享
众所周知,Modelscope 中文竞技场是一款备受关注和期待的智能辅助工具,帮助用户评估和比较不同机器学习模型的性能,它为中文自然语言处理任务提供了一个全新的评测平台。那么接下来就来分享一下Modelscope 中文竞技场的测试分享。
365 1
关于Modelscope 中文竞技场的测评分享
|
人工智能 自然语言处理 5G
ModelScope中文竞技场大模型测评
对双模型匿名对话的写作创作,知识常识和人类价值观方面进行分析
206 1
|
6月前
|
自然语言处理
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
158 1
|
6月前
|
API 语音技术
ModelScope-FunASR**有支持热词又支持时间戳的模型**。
【2月更文挑战第30天】ModelScope-FunASR**有支持热词又支持时间戳的模型**。
212 2

热门文章

最新文章