阿里云社区MS大模型评测

简介: 通过中文竞技场模型比较模型AB的优劣

第一
写作创作相关领域
问题1:请根据所提供的话题和相关资料,撰写一篇以“人工智能的发展对社会的影响”为主题的议论文。你的论点应该明确、扎实,并提供恰当的证据和例子来支持你的观点。注意保持中肯和客观,避免过多的个人情感和偏见。
QQ浏览器截图20230819214244.png
问题2:根据以下情境,请撰写一篇实用的应用文:
你是一位招聘经理,你的公司正在寻找一名合适的项目经理。请根据以下要求,撰写一篇应聘信,自我介绍并解释你为什么是最佳人选。
情境:你的公司最近启动了一个重要项目,需要一位经验丰富的项目经理来领导团队以确保项目顺利完成。你需要撰写一份应聘信,向公司董事会展示你的能力和专业知识,同时解释你在过去的项目中的成就和技能,以及为什么你是最佳人选。
请注意:不要提及具体的公司和项目名称,确保你的信件重点突出你的能力、成就和适应能力。同时要保持信件的专业性和亲和力,让阅读者相信你是最佳人选。
撰写应聘信时,请确保语法准确、结构合理,表达清晰、完整,并注意使用恰当的词汇和句式。
QQ浏览器截图20230819214814.png
问题3:你正在申请一家顶级大学的全额奖学金,请撰写一份能够让招生官员眼前一亮的个人陈述。你可以包括你的学术成就、领导才能或社区服务等方面的内容,并强调你为该大学所带来的独特贡献。记住,你的陈述应该既真实又有说服力,并展现出你的野心和成长潜力。
QQ浏览器截图20230819215124.png
第二:代码相关
问题1:请编写一个程序,要求从一个包含整数的列表中找到最大的数,并将其输出。
QQ浏览器截图20230819215313.png
问题2:请使用numpy库来计算一个矩阵的逆矩阵。
image.png
问题3:
模型A# 定义一个包含整数的数组
numbers = [1, 2, 3, 4, 5, 6]

定义一个包含目标值的数组

targets = [7, 8, 9, 10, 11, 12]

计算数组中每个数与目标值的距离

distances = np.sqrt(np.sum((numbers - targets)**2))

找到距离最小的数

index = 0
for i in range(len(numbers)):
if distances[i] < distances[index]:
index = i
print(index)
模型B
def find_closest_num(arr, target):
closest_num = float('inf')
closest_index = None
for i in range(len(arr)):
if arr[i] == target:
closest_num = min(closest_num, arr[i])
closest_index = i
if closest_num == float('inf'):
return None
return closest_index

测试代码

arr = [2, 4, 1, 7, 5, 8]
target = 6
index = find_closest_num(arr, target)
if index is not None:
print(f"数组中最接近目标值的数是:{arr[index]},其索引是:{index}")
else:
print("数组中没有数最接近目标值")
第三:知识常识领域
问题1:请给我推荐一款适合日常使用的便携式蓝牙音箱。我希望它具备以下功能:持久的电池续航能力、高音质、便于携带。
image.png
问题2:请列举三种常见的急救措施。
QQ浏览器截图20230819220444.png
问题3:请根据以下数列规律,计算第10个数:1, 2, 4, 7, 11, 16, 22, 29, 37, ___。
image.png
总结:其实在知识常识领域的最后一个问题之前我的内心都是偏向于模型B的,虽然模型B的回答相较于模型A来说确实是比较干净利索的,但是对于我来说,我可能更需要像模型B这样的回答虽然冗长但很详尽的答案,直到最后一个领域的最后一题,模型B出现了一个不应该出现的错误,使得它的答案跟问题并没有什么太大的关系,这个在我心中还是比较减分的。但是从总体来看模型B还是相当不错的。不可否认的是模型AB在生活中可以帮到我们许多

相关文章
|
6月前
|
数据可视化 物联网 Swift
谷歌发布开源LLM Gemma,魔搭社区评测+最佳实践教程来啦!
Gemma是由Google推出的一系列轻量级、先进的开源模型,他们是基于 Google Gemini 模型的研究和技术而构建。
|
12月前
|
人工智能 监控 Swift
魔搭社区LLM模型部署实践 —— 以ChatGLM3为例
本文将以ChatGLM3-6B为例,介绍在魔搭社区如何部署LLM
|
15天前
|
人工智能 算法 测试技术
PAI 大语言模型评测平台现已支持裁判员模型评测
本文将为您介绍如何在 PAI 大语言模型评测平台,基于裁判员模型,评价开源模型或者微调后模型的性能。该功能限时免费,欢迎使用。
|
6月前
|
算法 计算机视觉 开发者
YOLOv10发布,性能效率双提升,魔搭社区最佳实践来啦!
YOLO(You Only Look Once)系列目标检测框架,由于其在计算成本与检测性能之间实现了有效平衡,故而成为实时物体检测领域的标杆。
|
12天前
|
人工智能 自然语言处理 监控
CAP项目体验评测报告
CAP项目体验评测报告概述了CAP在快速部署、性能测试、二次开发及模板库等方面的体验。报告指出CAP在自动化配置、性能稳定性和开发支持方面表现优异,但也提到了网络配置、文档详尽度和模板丰富度等方面的改进空间。同时,报告还提出了CAP与阿里云其他产品联动的建议,以及在全生命周期管理中的改进建议。
29 0
|
4月前
|
人工智能 自然语言处理 算法
|
5月前
|
人工智能 自然语言处理 算法
阿里云PAI大模型评测最佳实践
在大模型时代,模型评测是衡量性能、精选和优化模型的关键环节,对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景,如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型,如何实现更全面准确且具有针对性的模型评测,从而在AI领域可以更好地取得成就。
|
6月前
|
人工智能 物联网 测试技术
以小博大,微软开源27亿参数模型Phi-2,魔搭最佳实践来啦!
近日,微软公布了在 Microsoft Ignite 2023大会上宣布开源的 Phi-2 模型的更多细节,“打破传统语言模型缩放定律,可PK比自己大25倍的模型”、“以小博大”等评价,让Phi-2一时间在开源社区中引发关注。
|
机器学习/深度学习 算法 安全
MS大模型评测有感
写作创作相关 知识常识 中文游戏
112 1
|
6月前
|
编解码 JSON 数据可视化
DeepSeek VL系列开源,魔搭社区模型微调最佳实践教程来啦!
3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,包含1.3b、7b两种不同规模的4个版本的模型。