|
30天前
|
并行计算 PyTorch 算法框架/工具
|

74_调试技巧:OOM与性能瓶颈

在大型语言模型(LLM)的开发与部署过程中,内存溢出(Out of Memory,简称OOM)错误和性能瓶颈问题是开发者经常面临的两大挑战。随着模型规模的不断扩大(从最初的BERT、GPT-2到现在的GPT-4、Claude 3等千亿甚至万亿参数的模型),这些问题变得更加突出。据2025年最新的开发者调查报告显示,超过78%的LLM开发者在模型训练或推理过程中遇到过OOM错误,而性能瓶颈则影响了约65%的生产环境部署。

124 0
|
30天前
|
存储 缓存 数据处理
|

71_数据版本控制:Git与DVC在LLM开发中的最佳实践

在2025年的大模型(LLM)开发实践中,数据和模型的版本控制已成为确保项目可重复性和团队协作效率的关键环节。与传统软件开发不同,LLM项目面临着独特的数据版本控制挑战:

192 0
|
30天前
|
存储 机器学习/深度学习 监控
|

67_Transformers库进阶:模型加载与配置优化

随着大型语言模型(LLM)技术的迅速发展,Hugging Face的Transformers库已经成为LLM开发和应用的标准工具包。作为一个开源的深度学习库,Transformers提供了丰富的预训练模型、统一的接口设计以及强大的生态系统,使得研究人员和开发者能够便捷地构建、训练和部署各类语言模型。2025年,Transformers库已经发展到5.x系列,不仅支持最新的GPU架构和量化技术,还提供了更完善的分布式训练能力和内存优化方案。

138 1
|
30天前
|
机器学习/深度学习 监控 PyTorch
|

68_分布式训练技术:DDP与Horovod

随着大型语言模型(LLM)规模的不断扩大,从早期的BERT(数亿参数)到如今的GPT-4(万亿级参数),单卡训练已经成为不可能完成的任务。分布式训练技术应运而生,成为大模型开发的核心基础设施。2025年,分布式训练技术已经发展到相当成熟的阶段,各种优化策略和框架不断涌现,为大模型训练提供了强大的支持。

279 0
|
30天前
|
存储 机器学习/深度学习 监控
|

69_云端开发:SageMaker与Colab

在2025年的大模型开发环境中,云端开发平台已经成为开发者的首选。随着大模型规模的不断扩大,本地开发环境往往难以满足训练和推理的需求,而云端平台提供了强大的计算资源、灵活的扩展能力和便捷的协作功能。在众多云端开发平台中,Amazon SageMaker和Google Colab凭借各自的优势,成为了大模型开发者最常用的两个选择。

115 0
|
30天前
|
Prometheus 监控 Cloud Native
|

72_监控仪表盘:构建LLM开发环境的实时观测系统

在2025年的大模型(LLM)开发实践中,实时监控已成为确保模型训练效率和生产部署稳定性的关键环节。与传统软件开发不同,LLM项目面临着独特的监控挑战

111 0
|
30天前
|
机器学习/深度学习 PyTorch TensorFlow
|

66_框架选择:PyTorch vs TensorFlow

在2025年的大语言模型(LLM)开发领域,框架选择已成为项目成功的关键决定因素。随着模型规模的不断扩大和应用场景的日益复杂,选择一个既适合研究探索又能支持高效部署的框架变得尤为重要。PyTorch和TensorFlow作为目前市场上最主流的两大深度学习框架,各自拥有独特的优势和生态系统,也因此成为开发者面临的经典选择难题。

210 0
|
30天前
|
缓存 API 调度
|

70_大模型服务部署技术对比:从框架到推理引擎

在2025年的大模型生态中,高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂,如何在有限的硬件资源下实现高性能、低延迟的推理服务,成为了所有大模型应用开发者面临的核心挑战。

264 0
|
30天前
|
机器学习/深度学习 数据采集 自然语言处理
|

99_监督微调:Alpaca数据集格式与实现

在大语言模型(LLM)的开发和应用中,微调是将通用预训练模型转化为特定任务专家的关键步骤。监督微调(Supervised Fine-Tuning, SFT)作为微调的一种重要范式,通过人工标注的高质量数据集指导模型学习特定任务的输入输出模式,从而显著提升模型在目标任务上的性能。

475 0
|
30天前
|
人工智能 监控 安全
|

91_提示注入:安全提示工程

随着大型语言模型(LLM)技术的快速发展和广泛应用,AI系统正以前所未有的方式改变着我们的工作和生活。然而,这种强大的技术也带来了新的安全挑战,其中提示注入(Prompt Injection)攻击已成为最具威胁性的安全问题之一。提示注入攻击通过精心构造的输入,操纵或欺骗AI系统执行非预期行为,可能导致数据泄露、权限绕过、输出不当内容等严重后果

200 0
|
30天前
|
机器学习/深度学习 人工智能 监控
|

93_安全提示:过滤有害内容

随着大型语言模型(LLM)在各个领域的广泛应用,确保其安全性和可靠性已成为技术社区关注的焦点。2024-2025年,随着LLM能力的不断增强,其潜在风险也日益凸显。有害内容的生成和传播不仅可能造成社会危害,还会对企业和用户带来严重的法律和声誉风险。因此,构建强健的内容过滤机制已成为LLM应用部署的必要条件。

89 0
|
30天前
|
机器学习/深度学习 人工智能 自然语言处理
|

94_提示压缩:减少token消耗

在大语言模型(LLM)应用中,提示工程已成为提升模型性能和控制输出的关键技术。然而,随着模型能力的增强和应用场景的复杂化,提示文本往往变得冗长,导致token消耗急剧增加。这不仅直接影响到API调用成本,还可能超出模型的上下文窗口限制,特别是在使用GPT-4、Claude 3等大模型时,每1000个token的成本可能高达数美分。对于需要频繁交互或批量处理的应用场景,如客服系统、内容生成平台或自动化工作流,token消耗的优化就显得尤为重要。

259 0
|
30天前
|
机器学习/深度学习 数据采集 人工智能
|

100_RLHF(人类反馈强化学习)原理与实践

在大型语言模型(LLM)的发展历程中,我们见证了模型从简单的文本生成工具,逐渐演变为能够理解复杂指令、进行多轮对话、甚至展示创造性思维的智能系统。然而,这一进化并非仅仅依靠模型规模的增大和数据量的增加,更重要的是训练方法的创新。其中,人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)作为一种革命性的训练范式,在2022年随着ChatGPT的问世而广受关注,并在随后的GPT-4、Claude、Gemini等先进模型中得到广泛应用。

260 3
|
30天前
|
存储 人工智能 自然语言处理
|

96_主动学习提示:用户反馈驱动优化

在人工智能快速发展的今天,大型语言模型(LLM)已经成为各行各业的核心工具。然而,如何让LLM能够持续学习和适应新的需求,如何从用户交互中获取有价值的信息来优化模型性能,已经成为当前研究和应用的热点。主动学习提示(Active Learning Prompts)作为一种新型的提示工程技术,通过用户反馈的闭环系统,实现了模型能力的持续优化和提升。

86 0
|
30天前
|
存储 数据采集 人工智能
|

97_微调基础:全参数 vs LoRA

在2025年的大模型时代,微调技术已经成为将通用大语言模型(LLM)适配到特定领域和任务的核心技术手段。随着模型规模的不断膨胀——从早期的数十亿参数到如今的数千亿甚至万亿参数,如何在有限的计算资源下高效地微调大模型,成为AI工程师面临的关键挑战。本文将深入探讨两种主流的微调方法:全参数微调和LoRA(Low-Rank Adaptation)低秩适应微调,从原理、技术实现、资源需求、性能表现等多个维度进行全面对比分析,帮助读者在实际项目中做出最优的技术选择。

293 0
|
30天前
|
数据采集 机器学习/深度学习 自然语言处理
|

98_数据增强:提升LLM微调效果的关键技术

在大语言模型(LLM)的微调过程中,数据质量与数量往往是决定最终性能的关键因素。然而,获取高质量、多样化且标注准确的训练数据却常常面临诸多挑战:数据标注成本高昂、领域特定数据稀缺、数据分布不均等问题都会直接影响微调效果。在这种背景下,数据增强技术作为一种能够有效扩充训练数据并提升其多样性的方法,正发挥着越来越重要的作用。

212 1
|
30天前
|
人工智能 缓存 自然语言处理
|

95_跨任务提示:一次提示完成多种任务

在大语言模型(LLM)应用开发中,我们常常面临需要处理多个相关任务的场景。传统方法是为每个任务单独设计提示并调用API,这不仅增加了开发复杂度,还会导致token消耗增加和响应延迟累积。跨任务提示(Multi-Task Prompting)作为一种高效的提示工程技术,能够在单个提示中集成多个相关任务,让LLM一次调用完成多种处理需求。

54 0
|
30天前
|
机器学习/深度学习 人工智能 芯片
|

42_大语言模型的计算需求:从GPU到TPU

随着2025年大语言模型技术的持续突破和规模化应用,计算资源已成为推动AI发展的关键驱动力。从最初的CPU计算,到GPU加速,再到专用AI加速器的崛起,大语言模型的计算需求正在重塑全球数据中心的基础设施架构。当前,全球AI半导体市场规模预计在2027年将达到2380亿美元(基本情境)甚至4050亿美元(乐观情境),这一增长背后,是大语言模型对计算能力、内存带宽和能效比的极致追求。

212 0
|
30天前
|
人工智能 自然语言处理 安全
|

43_PaLM与Gemma:谷歌LLM演进

在人工智能发展的浪潮中,谷歌一直扮演着关键的技术引领者角色。从最初的神经机器翻译到如今的通用人工智能,谷歌通过持续的技术创新推动着自然语言处理领域的边界不断拓展。2022年,谷歌推出了革命性的PaLM(Pathways Language Model),这一模型不仅在规模上达到了前所未有的5400亿参数,更重要的是其采用了创新的Pathways训练方法,为大型语言模型的发展开辟了新路径。随后,谷歌又推出了Gemma系列开源模型,将先进的AI技术普惠给更广泛的开发者社区。

156 2
|
2月前
|
机器学习/深度学习 并行计算 小程序
|

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性( Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制…

428 0
|
2月前
|
自然语言处理 机器人 图形学
|

腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型

腾讯混元图像3.0,真的来了——开源,免费开放使用。 正式介绍一下:混元图像3.0(HunyuanImage 3.0),是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对…

528 2
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

Tongyi DeepResearch的技术报告探秘

引言阿里通义实验室悄悄(其实动静不小)发布了一个叫 Tongyi DeepResearch 的 Agent 项目。它没有开发布会,没请明星站台,甚至没发通稿——但它在 GitHub 上架当天,就登顶了“每日趋势榜”。这速度,比人类发现…

345 2
|
2月前
|
存储 人工智能 文字识别
|

PDF解析迎来技术革新!阿里新产品实现复杂文档端到端结构化处理

前言9月24日云栖大会现场,由阿里巴巴爱橙科技数据技术及产品团队自主研发的 PDF解析神器正式亮相并同步开源模型。这款基于Logics-Parsing模型构建的AI工具直指当前PDF解析领域的技术痛点,显著提升复杂文档的结构…

377 0
|
2月前
|
人工智能 数据处理 云栖大会
|

云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相

云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相

272 9
|
2月前
|
缓存 自然语言处理 并行计算
|

腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

205 2
|
2月前
|
分布式计算 测试技术 Spark
|

科大讯飞开源星火化学大模型、文生音效模型

近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。

179 2
|
2月前
|
机器学习/深度学习 缓存 测试技术
|

LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速!

LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速!

100 0
|
2月前
|
人工智能 安全 开发者
|

全网寻!魔搭社区×小红书科技「模法师创造营」等你加入!

寻找和魔搭、@科技薯 并肩同行的「模」法师 代码之外,一起成为技术布道师!

82 1
|
2月前
|
人工智能 编解码 自然语言处理
|

重磅更新!ModelScope FlowBench 支持视频生成 + 图像编辑,AI创作全面升级!

很高兴地向大家宣布,ModelScope FlowBench 客户端迎来重大功能升级! 本次更新不仅正式支持了视频节点功能,还新增了图像编辑与IC-Light智能打光等实用功能,同时对多个图像处理节点进行了深度优化和扩展。现在,您只需在 FlowBench 中轻松串联节点,即可使用 Wan2.1/Wan2.2、Qwen-Image-Edit、FLUX Kontext、IC-Light等强大模型,轻松实现创意内容的生成与编辑。 无论你是内容创作者、视觉设计师,还是AI技术爱好者,这次更新都将为你打开全新的创作边界。

433 14
|
2月前
|
人工智能 物联网 API
|

ModelScope魔搭25年9月发布月报

ModelScope魔搭25年9月发布月报

275 10
|
2月前
|
人工智能
|

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

四大公益场景,20万奖金!AI开源公益创新挑战赛邀你一起「小有可为」

134 8
|
2月前
|
编解码 文字识别 自然语言处理
|

腾讯混元生图模型升级2.1版本:支持写字、2k分辨率,开源!

腾讯混元生图模型升级2.1版本:支持写字、2k分辨率,开源!

260 14
|
2月前
|
调度 开发者 异构计算
|

冠军10万美金!AMD 2025 分布式推理算子优化挑战赛来了

冠军10万美金!AMD 2025 分布式推理算子优化挑战赛来了

259 13
|
2月前
|
人工智能 数据可视化 定位技术
|

不会编程也能体验的 AI 魔法,外滩大会代码原生地等你解锁

不会编程也能体验的 AI 魔法,外滩大会代码原生地等你解锁

359 39
|
2月前
|
人工智能 算法 数据挖掘
|

魔搭社区携手AFAC2025金融智能创新大赛,共同孵化金融科技新星

8月27日,在上海市科学技术委员会指导下,由北京大学、清华大学、复旦大学、香港大学、蚂蚁集团等近30家海内外顶级院校、头部企业、孵化器等机构联合发起的AFAC2025金融智能创新大赛总决赛路演圆满结束。

220 9
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

通义实验室Mobile-Agent-v3开源,全平台SOTA的GUI智能体,支持手机电脑等多平台交互

近日,通义实验室MobileAgent团队正式开源全新图形界面交互基础模型 GUI-Owl,并同步推出支持多智能体协同的自动化框架 Mobile-Agent-v3。该模型基于Qwen2.5-VL打造,在手机端与电脑端共8个GUI任务榜单中全面刷新开源模型性能纪录,达成全平台SOTA。

493 2
|
2月前
|
存储 数据处理 数据库
|

公募REITs公告PDF文档处理项目

本项目是一个专门用于处理基础设施公募REITs(Real Estate Investment Trusts)公告PDF文件的完整RAG数据处理管道,也适用于其他公告PDF文件,应用多模态大模型,可高效提升文本提取内容。系统能够自动化地将PDF公告文档转换为结构化数据,能够检测表格、实现跨页表格拼接,并将表格内容还原为便于检索的文本信息。并构建向量数据库和 Elasticsearch 以支持智能检索与问答系统。

105 8
|
2月前
|
人工智能 关系型数据库 数据库
|

公募REITs专属AI多智能体查询分析项目

公募REITs专属AI多智能体查询分析项目。本项目是基于 OpenAI Agent 框架的多智能体项目,提供二级市场数据查询分析、招募说明书内容检索、公告信息检索、政策检索等多板块查询服务。支持图标绘制、文件生成。

112 2
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

B站开源IndexTTS2,用极致表现力颠覆听觉体验

在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。

1650 62
|
2月前
|
人工智能 安全 Devops
|

AI 驱动的 DevOps:通过智能命令执行实现基础设施自动化

本文探讨了如何利用能够根据自然语言提示执行命令、管理基础设施和自动部署的 AI 技术,来革新 DevOps 流程。通过模型上下文协议(MCP),AI 助手不仅能回答问题,还能直接操作终端、编辑文件并管理开发环境,从而简化复杂的 DevOps 任务,提高效率并降低错误率。

245 3
|
2月前
|
Kubernetes Devops Docker
|

Kubernetes 和 Docker Swarm:现代 DevOps 的理想容器编排工具

本指南深入解析 Kubernetes 与 Docker Swarm 两大主流容器编排工具,涵盖安装、架构、网络、监控等核心维度,助您根据团队能力与业务需求精准选型,把握云原生时代的技术主动权。

220 1
|
2月前
|
Kubernetes Devops API
|

从零到面试高手:每个 DevOps 专业人士都必须知道的 20 个 Kubernetes 架构问答

Kubernetes 是当前 DevOps、云原生和 SRE 领域的关键技能。本文总结了 20 个高频面试问题,涵盖架构组件、工作原理及核心概念,助你轻松掌握 Kubernetes 基础,提升面试与实战能力。

204 2
|
2月前
|
XML 自然语言处理 数据可视化
|

免费!文本表格不会总结、分析?文本表格可视化!帮你轻松解决困扰,保姆级级教程。【附Coze工作流】

本文介绍了如何利用“扣子”平台创建资源,通过可视化工作流处理并分析文档、表格、PDF等内容,帮助用户快速获取文件核心信息。内容涵盖登录、资源创建、工作流配置及运行操作,适用于多种文件格式,如CSV、Excel、PDF等。

588 3
|
2月前
|
监控 Devops 持续交付
|

从 DevOps 文化到以平台为中心的交付

DevOps 工程师与平台工程师在软件交付中各司其职。DevOps 强调开发与运维协作,推动自动化与文化变革;平台工程则聚焦构建自助式内部开发者平台,提升开发效率与一致性。两者相辅相成,共同加速高质量软件交付。

179 1
|
2月前
|
缓存 人工智能 测试技术
|

腾讯混元 3D 世界模型家族又添新成员Voyager:支持超长距离漫游

9 月 2 日,腾讯混元宣布,其3D世界模型系列最新成员——HunyuanWorld-Voyager(简称混元Voyager)发布并开源,这将推动AI在空间智能领域的应用扩展,为虚拟现实、物理仿真、游戏开发等领域提供高保真3D场景漫游能力,加速行业应用落地。

148 0
|
2月前
|
人工智能 前端开发 测试技术
|

Kimi K2 模型更新,带来更强的代码能力、更快的 API

今天,Kimi K2 模型的最新版本 0905 开源发布,进一步提升其在真实编程任务中的表现

538 0
|
2月前
|
人工智能 自然语言处理 前端开发
|

魔搭社区模型速递(8.30-9.06)

🙋魔搭ModelScope本期社区进展:3361个模型,313个数据集,73个创新应用, 8篇内容

304 1
|
2月前
|
人工智能 编解码 数据可视化
|

原生支持QwenImage!FlowBench 正式开启公测!本地 + 云端双模生图,AI创作更自由

FlowBench 是由 ModelScope x Muse 团队打造的一站式 AI 工作流创作平台,现已开启全面公测。该平台以工作流为核心,支持本地与云端资源协同运行,面向开发者、设计师及 AI 创作者提供高效、稳定、易用的可视化创作体验。FlowBench 原生支持 QwenImage 图像生成模型,最低仅需 8GB 显存即可实现本地生图,并支持多 LoRA 融合、多图批量生成等强大功能。用户可在 Mac 和 Windows 系统下载使用,同时享受云端与本地自由切换带来的灵活体验。公测期间,FlowBench 团队将持续优化功能,推出更多创新特性,助力用户开启高效 AI 创作之旅。

477 11
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

阶跃星辰开源! Step 3 :最新一代基础大模型 ,多模推理,极致效率

阶跃星辰开源新一代大模型 Step 3,采用 MoE 架构,参数量达 321B,激活参数 32B,平衡推理效率与资源利用,具备强大多模态能力,支持复杂推理与视觉分析,已在多个评测集取得领先成绩。

253 10
|
2月前
|
人工智能
|

黑森林开源Flux.1 Krea Dev!魔搭AIGC专区Day1支持,提供生图与训练定制

FLUX模型又又又更新了! 黑森林联合Krea发布了文生图模型Flux.1 Krea Dev,这是目前最好的开源文生图模型。 魔搭社区第一时间上线Flux.1 Krea Dev,快来AIGC专区抢先体验图片

275 11

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
14399
内容
6
活动
3686
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互