文章标签:
异构计算
人工智能
机器学习/深度学习
AI芯片
物联网
相关文章
JJLIN距离
|
6月前
|
负载均衡
测试技术
调度
大模型分布式推理:张量并行与流水线并行技术
本文深入探讨大语言模型分布式推理的核心技术——张量并行与流水线并行。通过分析单GPU内存限制下的模型部署挑战,详细解析张量并行的矩阵分片策略、流水线并行的阶段划分机制,以及二者的混合并行架构。文章包含完整的分布式推理框架实现、通信优化策略和性能调优指南,为千亿参数大模型的分布式部署提供全面解决方案。
JJLIN距离
1572
4
4
代码bug生产队
|
6月前
|
人工智能
机器人
人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
代码bug生产队
422
117
117
阿里云开发者
|
6月前
|
人工智能
安全
开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
阿里云开发者
1204
24
24
bug菌
|
6月前
|
人工智能
文字识别
自然语言处理
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
近期,在第八届中国模式识别与计算机视觉学术会议(PRCV 2025)上,合合信息作为承办方举办了“多模态文本智能大模型前沿技术与应用”论坛,汇聚了学术界的顶尖智慧,更抛出了一颗重磅“炸弹”——“多模态文本智能技术”概念。
bug菌
284
1
1
JJLIN距离
|
6月前
|
监控
算法
测试技术
大模型推理服务优化:动态批处理与连续批处理技术
本文系统阐述大语言模型推理服务中的关键技术——动态批处理与连续批处理。通过分析传统静态批处理的局限性,深入解析动态批处理的请求调度算法、内存管理策略,以及连续批处理的中断恢复机制。文章包含完整的服务架构设计、核心算法实现和性能基准测试,为构建高性能大模型推理服务提供全面解决方案。
JJLIN距离
765
3
3
魔羯座liaotianfeile
|
6月前
|
存储
缓存
算法
淘宝买家秀 API 深度开发:多模态内容解析与合规推荐技术拆解
本文详解淘宝买家秀接口(taobao.reviews.get)的合规调用、数据标准化与智能推荐全链路方案。涵盖权限申请、多模态数据清洗、情感分析、混合推荐模型及缓存优化,助力开发者提升审核效率60%、商品转化率增长28%,实现UGC数据高效变现。
魔羯座liaotianfeile
405
0
0
basu2023
|
6月前
|
存储
人工智能
搜索推荐
拔俗AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教融合大语言模型、教育知识图谱、多模态感知与智能体技术,重构“教、学、评、辅”全链路。通过微调LLM、精准诊断错因、多模态交互与自主任务规划,实现个性化教学。轻量化部署与隐私保护设计保障落地安全,未来将向情感感知与教育深度协同演进。(238字)
basu2023
677
0
0
探索云世界
|
7月前
|
人工智能
自然语言处理
IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
探索云世界
1160
109
109
modelscope
|
7月前
|
分布式计算
测试技术
Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
modelscope
627
2
2
热门文章
最新文章
1
中文竞技场(MS)大模型评测
2
科普神文,一次性讲透AI大模型的核心概念
3
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
4
全新开源通义千问Qwen3,它来了!
5
阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
6
通义千问72B、1.8B、Audio模型开源!魔搭社区最佳实践来啦!
7
企业AI落地实践(三):使用 AI 网关解决 AI Agent 与 LLM 的交互挑战
8
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
9
NL2SQL基础系列(2):主流大模型与微调方法精选集,Text2SQL经典算法技术回顾七年发展脉络梳理
10
AI大模型进阶系列(01)看懂AI大模型的主流技术 | AI对普通人的本质影响是什么
1
大模型强化学习的熵控制:CE-GPPO、EPO与AsyPPO技术方案对比详解
438
2
当AI开始“思考”:为什么大模型的尽头是推理?
558
3
大模型分布式推理:张量并行与流水线并行技术
1572
4
构建AI智能体:一、初识AI大模型与API调用
2278
5
【大模型微调】一文掌握5种大模型微调的方法
5882
6
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
284
7
AI Agent的未来之争:任务规划,该由人主导还是AI自主?——阿里云RDS AI助手的最佳实践
1226
8
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
1204
9
Qwen3-VL新成员 2B、32B来啦!更适合开发者体质
5927
10
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
738
相关商品
相关解决方案
更多
云消息队列 RabbitMQ 实践
零代码微调,打造领域专属大模型
触手可及,函数计算玩转 AI 大模型
文件下载加速及成本优化
告别低效沟通,使用大模型发起语音通话
相关课程
更多
阿里云大模型工程师ACA认证课程
阿里云百炼大模型产品实践
ADB-PG+大模型一站式AIGC解决方案
阿里云百炼,手把手教你如何构建企业大模型应用服务
云原生AI套件:一键训练大模型及部署GPU共享推理服务
【开眼界】大模型时代的个人应对策略
相关电子书
更多
OpenSearch向量检索和大模型方案
通义万相:视觉生成大模型的进化与应用
达摩院通义视觉生成大模型
下一篇
PHP:将本地文件上传到阿里云OSS存储