大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 "" 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
文章
正文
GDC2025 | 探索最前沿的开源大模型技术与创新,2025全球开发者先锋大会,上海见!
2025-02-19
462
版权
版权声明:
本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《
阿里云开发者社区用户服务协议
》和 《
阿里云开发者社区知识产权保护指引
》。如果您发现本社区中有涉嫌抄袭的内容,填写
侵权投诉表单
进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
简介:
2025全球开发者先锋大会将于2月21-23日在徐汇盛大召开!大会以“模塑全球 无限可能”为主题,定位“社区的社区”,旨在促进基模、垂模、语料、算力、基金、开发者、软件服务等产业生态深度对接。
文章标签:
开发者
自然语言处理
modelscope
目录
相关文章
JJLIN距离
|
8月前
|
负载均衡
测试技术
调度
大模型分布式推理:张量并行与流水线并行技术
本文深入探讨大语言模型分布式推理的核心技术——张量并行与流水线并行。通过分析单GPU内存限制下的模型部署挑战,详细解析张量并行的矩阵分片策略、流水线并行的阶段划分机制,以及二者的混合并行架构。文章包含完整的分布式推理框架实现、通信优化策略和性能调优指南,为千亿参数大模型的分布式部署提供全面解决方案。
JJLIN距离
2371
4
5
JJLIN距离
|
8月前
|
机器学习/深度学习
缓存
监控
大模型推理优化技术:KV缓存机制详解
本文深入探讨了大语言模型推理过程中的关键技术——KV缓存(Key-Value Cache)机制。通过对Transformer自注意力机制的分析,阐述了KV缓存的工作原理、实现方式及其对推理性能的显著优化效果。文章包含具体的代码实现和性能对比数据,为开发者理解和应用这一关键技术提供实践指导。
JJLIN距离
2397
9
10
JJLIN距离
|
8月前
|
存储
机器学习/深度学习
人工智能
大模型微调技术:LoRA原理与实践
本文深入解析大语言模型微调中的关键技术——低秩自适应(LoRA)。通过分析全参数微调的计算瓶颈,详细阐述LoRA的数学原理、实现机制和优势特点。文章包含完整的PyTorch实现代码、性能对比实验以及实际应用场景,为开发者提供高效微调大模型的实践指南。
JJLIN距离
3175
3
8
代码bug生产队
|
8月前
|
人工智能
机器人
人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
代码bug生产队
482
117
117
Q一个好的名字容易让人记住你2483558220
|
9月前
|
监控
JavaScript
Java
基于大模型技术的反欺诈知识问答系统
随着互联网与金融科技发展,网络欺诈频发,构建高效反欺诈平台成为迫切需求。本文基于Java、Vue.js、Spring Boot与MySQL技术,设计实现集欺诈识别、宣传教育、用户互动于一体的反欺诈系统,提升公众防范意识,助力企业合规与用户权益保护。
Q一个好的名字容易让人记住你2483558220
438
127
127
basu2023
|
8月前
|
人工智能
自然语言处理
安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
basu2023
1447
23
25
JJLIN距离
|
8月前
|
机器学习/深度学习
存储
并行计算
大模型推理加速技术:FlashAttention原理与实现
本文深入解析大语言模型推理加速的核心技术——FlashAttention。通过分析传统注意力机制的计算瓶颈,详细阐述FlashAttention的IO感知算法设计、前向反向传播实现,以及其在GPU内存层次结构中的优化策略。文章包含完整的CUDA实现示例、性能基准测试和实际部署指南,为开发者提供高效注意力计算的全套解决方案。
JJLIN距离
1548
10
11
bug菌
|
8月前
|
人工智能
文字识别
自然语言处理
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
近期,在第八届中国模式识别与计算机视觉学术会议(PRCV 2025)上,合合信息作为承办方举办了“多模态文本智能大模型前沿技术与应用”论坛,汇聚了学术界的顶尖智慧,更抛出了一颗重磅“炸弹”——“多模态文本智能技术”概念。
bug菌
337
1
1
JJLIN距离
|
8月前
|
存储
人工智能
算法
大模型4-bit量化技术详解
本文系统阐述大语言模型的4-bit量化技术,深入解析GPTQ、AWQ等主流量化方法的原理与实现。通过详细的数学推导、代码实现和实验对比,展示4-bit量化如何将模型内存占用降低75%以上同时保持模型性能。文章涵盖量化感知训练、后训练量化、混合精度量化等关键技术,为开发者提供完整的模型压缩解决方案。
JJLIN距离
1846
7
7
JJLIN距离
|
8月前
|
监控
算法
测试技术
大模型推理服务优化:动态批处理与连续批处理技术
本文系统阐述大语言模型推理服务中的关键技术——动态批处理与连续批处理。通过分析传统静态批处理的局限性,深入解析动态批处理的请求调度算法、内存管理策略,以及连续批处理的中断恢复机制。文章包含完整的服务架构设计、核心算法实现和性能基准测试,为构建高性能大模型推理服务提供全面解决方案。
JJLIN距离
1044
3
4
ModelScope模型即服务
热门文章
最新文章
1
高效部署通义万相Wan2.1:ComfyUI文生/图生视频实战,工作流直取!
2
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
3
嵌入式开发必备!Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含(Keil MDK 5.39)
4
美团开源发布 LongCat-Flash-Chat:专为高效智能体任务设计,推理速度超100 tokens/s
5
在 AMD ROCm DSW 上跑通 DeepSeek-V4-Flash:vLLM 兼容部署、长上下文验证与 8K 性能扫参
6
阿里云通义千问向全社会开放!
7
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
8
DeepSeek-V4开源:百万上下文,Agent能力比肩顶级闭源模型
9
docker安装部署FunASR
10
Seedance vs Sora vs Kling:AI 视频生成模型深度对比
1
书尖AI携手阿里云云端算力,打造智能阅读与轻量化学习新体验
64
2
可计算元认知文本分析:跨领域语义漂移的多层解释框架与实证研究
36
3
🔥【零基础逆袭】我用Python写了个量化策略,3天赚了别人3年的钱!(附完整代码+教程)
97
4
ChatGPT 怎么导出 Word?保留公式、表格和代码块的实用流程
43
5
语义压缩,才是提示词工程的底层心法
44
6
别再让 AI 自动总结 Skill 了!
36
7
AI Agent 接入股票数据时,为什么要先设计数据工具层
35
8
别再让 AI 自动总结 Skill 了!
36
9
自变量开源Wall-OSS-0.5:预训练即可部署的具身智能大模型,17个零样本任务验证泛化能力
32
10
阶跃开源 Step 3.7 Flash:面向生产级 Agent 的高效率 Flash 模型
51
相关课程
更多
阿里云大模型能力培训(永耀)
国家电网大模型ACP培训
大模型 Clouder认证:基于PAI ArtLab的AIGC设计基础
阿里云大模型工程师ACA认证课程
阿里云百炼大模型产品实践
相关电子书
更多
OpenSearch向量检索和大模型方案
通义万相:视觉生成大模型的进化与应用
达摩院通义视觉生成大模型
下一篇
阿里云正式发布 Agentic 代码安全:AI驱动的双Agent协同引擎