智谱AI数学课代表MathGLM魔搭首发,社区体验推理教程来啦!

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: GLM家族又发布了一个新成员 数学模型 MathGLM ,以提升大语言模型的数学推理能力。它可以在不使用计算器工具的情况下,高效执行复杂算术运算,解答中文数学应用题,已经在魔搭社区全球首发开源啦!

导读


刚刚,GLM家族又发布了一个新成员 数学模型 MathGLM ,以提升大语言模型的数学推理能力。它可以在不使用计算器工具的情况下,高效执行复杂算术运算解答中文数学应用题,已经在魔搭社区全球首发开源啦!


老规矩,还是最新鲜的社区体验、推理实践教程跟上,快一起来看看 MathGLM 这个理科生的表现吧~



环境配置与安装



使用步骤

本文主要演示的模型为MathGLM模型,在ModelScope的免费Notebook的环境(这里以PAI-DSW为例)的配置下运行(显卡类型为A10, 显存24G)


服务器连接与环境准备

1、进入ModelScope首页:modelscope.cn,进入我的Notebook



2、选择GPU环境,进入PAI-DSW在线开发环境



3、新建Notebook



4. 安装相关的python包


pip install SwissArmyTransformer==0.2.*



创空间体验



创空间体验链接(点击文末阅读原文直达):

https://www.modelscope.cn/studios/ZhipuAI/MathGLM-demo/summary


MathGLM 旨在增强大模型在数学推理上的性能,主要关注在精确计算算术运算(基础算术运算和复杂混合运算)和提升模型的中文数学解决能力,接下来,我们就重点考察一下这两部分的能力:


先看算术能力


  • 高位数加减乘除


  • 解方程


算术基础还是很扎实的,再看看生活中的数学理解及应用题解题情况


  • 算价格


  • 分苹果余数问题


  • 浓度计算类



模型链接及下载



MathGLM 模型现已在ModelScope社区开源:

https://modelscope.cn/models/ZhipuAI/MathGLM/summary


社区支持直接下载模型的repo:

from modelscope import snapshot_download, Model, pipeline, Tasks
model_dir = snapshot_download('ZhipuAI/MathGLM', revision='v1.0.0')



模型推理


推理代码:

方法1:使用model推理

from modelscope import snapshot_download, Model, pipeline, Tasks
model_dir = snapshot_download('ZhipuAI/MathGLM', revision='v1.0.0')
model = Model.from_pretrained(model_dir)
query = '鸡和兔在一个笼子里,共有35个头,94只脚,那么鸡有多少只?'
response = model(query)
print(response)
# x=35-((94-35*2)/(4-2))=35-((94-70)/(4-2))=35-(24/(4-2))=35-(24/2)=35-12=23


方法2:使用pipeline推理

from modelscope import snapshot_download, Model, pipeline, Tasks
model_dir = snapshot_download('ZhipuAI/MathGLM', revision='v1.0.0')
pipe = pipeline(task=Tasks.text_generation, model=model_dir)
query = '10*9*8=?'
response = pipe(query)
print(response)
# x=10*9*8=90*8=720


资源消耗:


MathGLM不俗的表现能让我们欣喜地看到LLM在数学能力上的潜力,相信未来LLM会更善于分析和解决实际问题,提供高效的解决方案,同时在决策和判断方面有更加敏锐的表现!


点击阅读原文,直达MathGLM创空间体验:https://www.modelscope.cn/studios/ZhipuAI/MathGLM-demo/summary

相关文章
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
36 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
8天前
|
人工智能 Serverless API
《智能导购 AI 助手构建》解决方案评测:极具吸引力的产品,亟待完善的教程文档
《智能导购 AI 助手构建》解决方案评测:极具吸引力的产品,亟待完善的教程文档
68 8
《智能导购 AI 助手构建》解决方案评测:极具吸引力的产品,亟待完善的教程文档
|
2天前
|
人工智能 移动开发 JavaScript
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
123 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
23天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
75 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
|
1天前
|
人工智能 供应链 安全
面向高效大模型推理的软硬协同加速技术 多元化 AI 硬件引入评测体系
本文介绍了AI硬件评测体系的三大核心方面:统一评测标准、平台化与工具化、多维度数据消费链路。通过标准化评测流程,涵盖硬件性能、模型推理和训练性能,确保评测结果客观透明。平台化实现资源管理与任务调度,支持大规模周期性评测;工具化则应对紧急场景,快速适配并生成报告。最后,多维度数据消费链路将评测数据结构化保存,服务于综合通用、特定业务及专业性能分析等场景,帮助用户更好地理解和使用AI硬件。
|
26天前
|
存储 机器学习/深度学习 PyTorch
【AI系统】推理文件格式
本文介绍了神经网络模型的序列化与反序列化技术,涵盖跨平台通用序列化方法(如 Protobuf 和 FlatBuffers)、模型自定义序列化方法、语言级通用序列化方法等,重点讨论了这两种流行文件格式的特点、使用场景及其在模型部署中的作用。
33 1
【AI系统】推理文件格式
|
5天前
|
人工智能 智能硬件
SPAR:智谱 AI 推出自我博弈训练框架,基于生成者和完善者两个角色的互动,提升了执行准确度和自我完善能力
SPAR 是智谱团队推出的自我博弈训练框架,旨在提升大型语言模型在指令遵循方面的能力,通过生成者和完善者的互动以及树搜索技术优化模型响应。
19 0
SPAR:智谱 AI 推出自我博弈训练框架,基于生成者和完善者两个角色的互动,提升了执行准确度和自我完善能力
|
26天前
|
机器学习/深度学习 人工智能 缓存
【AI系统】推理内存布局
本文介绍了CPU和GPU的基础内存知识,NCHWX内存排布格式,以及MNN推理引擎如何通过数据内存重新排布进行内核优化,特别是针对WinoGrad卷积计算的优化方法,通过NC4HW4数据格式重排,有效利用了SIMD指令集特性,减少了cache miss,提高了计算效率。
45 3
|
6天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
135 97

热门文章

最新文章