备案控制台

开发者社区云计算文章正文

MS大模型测评报告

2023-08-19 75

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 从写作创作相关、知识常识、中文游戏三个方向对大语言模型进行评测

第一个方向是写作创作相关，第一个问题是假设你是一名30多岁的煤矿企业的女性工作人员，请写一篇关于三八妇女节的征文。我认为模型B的回答更好，逻辑性强，内容也更加丰富，关注了女性在煤炭企业中的角色和贡献，强调了女性员工在生产一线的重要作用，提到了女性在平衡工作与家庭方面所面临的挑战，呼吁大家关爱身边的女性朋友，共同为实现女性的平等地位和权益而努力。

方向一的第二个问题是请比较两个模型的关于三八妇女节的征文，模型A就明显答非所问了，模型B可能无法获取到模型A的回答，虽然给出的答案不是真正比较了两个模型的回答，但格式正确，的确是回答了关于比较的问题，还给出了总结。

方向二是知识常识，模型A的会回答得更详细，更美观。

方向三我选择了中文游戏，模型A的回答更加分类明确、条理，成语解释得更加通俗易懂。

lemon。

目录

相关文章

喜欢猪猪

|

11月前

|

人工智能运维监控

函数计算3.0测评报告

Serverless应用中心是阿里云面向Serverless应用的一站式开发及生命周期管理平台。通过Serverless应用中心，您可以有效聚焦业务场景，快速开发及部署Serverless应用、白屏化操作资源提高运维效率，实现应用的全生命周期的管理，点击这里了解更多详情。

喜欢猪猪

74 1 1

乔治麦

|

12天前

|

存储人工智能自然语言处理

本方案利用AI大模型实现电话沟通内容的自动化质检，涵盖音频上传、转文字、对话分析及结果展示，采用先进NLP与语音识别技术，高效处理大量数据。文档详尽，示例代码完整，部署顺畅。适用于电话质检，建议扩展至多渠道数据整合、大模型微调及情感分析。

乔治麦

33 2 2

云安全专家

|

2月前

|

人工智能安全算法

《大模型安全研究报告（2024年）》正式发布

速来get～

云安全专家

362 7 7

叫做饺子

|

3月前

|

监控搜索推荐语音技术

测试使用SenseVoice大模型测评

测试使用SenseVoice大模型测评

叫做饺子

75 4 4

極極極0517

|

机器学习/深度学习算法安全

MS大模型评测有感

写作创作相关知识常识中文游戏

極極極0517

112 1 1

喜欢在风中追逐的你

|

人工智能索引 Python

阿里云社区MS大模型评测

通过中文竞技场模型比较模型AB的优劣

喜欢在风中追逐的你

216 0 0

高端源码库

LIS系统源码：涵盖实验室的全部管理流程，包括从检验申请、标本采集、实验检测、报告发布等

1）与HIS系统无缝对接，共享缴费信息，生成检验申请单。 2）通过条形码、手工添加、电子申请单等多种方式录入样本。 3）自动接收检验结果，并根据患者的标本、年龄、性别等判断结果异常状态。 4）危急值提示，批量审核、打印，质控样本等功能协助医生更好的开展检验工作。 5）操作多台设备，自由切换，和操作单台设备一样。

高端源码库

125 0 0

快叫嗯哼大王

MS大模型评测

对几个模型的看法

快叫嗯哼大王

125 0 0

大大怪的家

|

数据可视化机器人 C++

对MS大模型测评内容分享

对三个领域分别进行三个问题的体验

大大怪的家

115 0 0

極识醒乐0212

ms大模型评测有感

对于ms大模型评测对信息的处理还有待人民检查提高，因此我们对大模型进行评测。

極识醒乐0212

76 0 0

热门文章

最新文章

一个免费功能强大的谷歌翻译api

Intellij IDEA 查找接口实现类的快捷键

阿里Java代码规约插件即将全球首发，邀您来发布仪式现场

淘宝 NPM 镜像

阿里JAVA手册之MySQL数据库（建表规约、索引规约、SQL语句、ORM映射）

MySQL数据表生成ER图

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html><head><meta http-equiv="Cont

Java中的定时器

[ACM_模拟] UVA 10881 Piotr's Ants[蚂蚁移动数组映射排序技巧]

Oracle高级队列(Advanced Queue)初体验

小程序数据绑定机制的优点

小程序的 API 做了什么处理，能够做到全局变量的隐藏

在 Babel 插件中使用 TypeScript 类型

Kotlin - 函数与Lambda表达式

Kotlin - 区间与数组

Kotlin - 运算符与中缀表达式

babel 原理，怎么写 babel 插件

Kotlin - 面向对象之抽象类与接口

Kotlin - 参数与异常

Kotlin - 分支与循环

相关课程

更多

2020版大数据实战项目之DMP广告系统（第二阶段）

2020版大数据实战项目之DMP广告系统（第五阶段）

2020版大数据实战项目之DMP广告系统（第六阶段）

2020版大数据实战项目之DMP广告系统（第七阶段）

2020版大数据实战项目之DMP广告系统（第一阶段）

相关电子书

更多

大模型安全研究报告2024

2016钱盾安全报告（8月版）

基于数据资产全生命周期估值与实践报告

下一篇

在 BatchCompute 上玩转 Blender 渲染