企业内训|DeepSeek技术革命、算力范式重构与场景落地洞察-某头部券商

简介: 3月19日北京,TsingtaoAI公司负责人汶生受邀为某证券公司管理层和投资者举办专题培训,围绕《DeepSeek技术革命、算力范式重构与场景落地洞察》主题,系统阐述了当前AI技术演进的核心趋势、算力需求的结构性变革,以及行业应用落地的关键路径。此次分享会基于DeepSeek开源大模型的技术突破与昇腾国产算力生态的实践,为从业者提供了深刻的行业洞察。

3月19日北京,TsingtaoAI公司负责人汶生受邀为某证券公司管理层和投资者举办专题培训,围绕《DeepSeek技术革命、算力范式重构与场景落地洞察》主题,系统阐述了当前AI技术演进的核心趋势、算力需求的结构性变革,以及行业应用落地的关键路径。此次分享会基于DeepSeek开源大模型的技术突破与昇腾国产算力生态的实践,为从业者提供了深刻的行业洞察。

技术革命:DeepSeek六大创新突破AI效率边界

DeepSeek作为开源大模型的代表,通过多项底层技术创新,显著降低了AI训练与推理成本,重塑了技术效率天花板:

  1. MoE规模化与动态负载均衡:基于256路由专家动态分配策略,稀疏激活专家模块,训练效率提升至每万亿Token仅需180K H800 GPU小时,千亿参数模型训练成本仅为Meta Llama 4的2%。
  2. Flash MLA隐空间注意力机制:通过优化KV Cache,推理内存消耗降低30%,H800 GPU内存带宽达3000 GB/s,浮点性能接近硬件理论峰值。
  3. DeepEP高速通讯网络:结合NVLink与RDMA技术,实现多专家协作时的高吞吐、低延迟,解决分布式训练中的传输瓶颈。
  4. DeepGEMM极简矩阵运算库:仅300行核心代码支持非标准块大小与指令级优化,FP8计算+高精度汇总技术使边缘设备部署复杂矩阵运算成为可能。
  5. 三项优化并行策略:DualPipe双向流水线算法、EPLB负载均衡器与Profile-data性能剖析工具,将计算与通信效率提升40%以上。
  6. Fire-Flyer高性能文件系统:在180节点集群中实现6.6TiB/s聚合读取吞吐,为AI任务提供稳定数据访问。

汶生强调,DeepSeek的技术架构创新不仅降低了训练成本,更通过推理端优化,推动AI从“重训练”向“重推理”的范式转移。

算力重构:推理需求爆发催生“深蓝海”市场

随着Scaling Law边际效益递减,单纯堆叠算力与参数规模已无法实现AI性能的跨越式提升。DeepSeek的技术优化与开源策略,加速了行业资源向推理端的倾斜:

  • 训练瓶颈凸显:以Llama 3.1 405B模型为例,训练一次需消耗3.8×10²⁵ FLOPs,相当于3.9万张H100 GPU运行60天,高昂成本倒逼企业转向轻量化部署。
  • 推理需求指数级增长:以ChatGPT月均14亿次访问为例,千亿参数模型单场景推理需2.6万张A100 GPU支持,而智能驾驶、物联网等场景对低延迟、高并发的要求进一步推升算力需求。
  • 国产算力生态破局:昇腾联合DeepSeek推出“开箱即用”一体机,支持V3/R1等模型在金融、政务等场景快速落地,单机吞吐最高达7500 Token/s,并发能力提升300%。华为、浪潮等厂商的服务器订单量激增,标志着推理端算力市场进入爆发期。

汶生预测,未来3年推理算力市场规模将远超训练端,成为驱动AI芯片与服务器增长的核心引擎。

场景落地:AI Agent与行业应用井喷

技术突破与算力重构的合力下,AI正从“技术探索”迈向“场景深耕”:

  • AI Agent成为AGI钥匙:Manus等通用Agent通过“规划-执行-验证”闭环架构、72小时长任务托管及多模型动态调度。
  • RAG取代微调成主流:面对模型快速迭代,RAG与扩展上下文组合显著降低开发门槛,企业更倾向采用云端MaaS服务而非私有化微调。
  • 行业应用全面渗透:DeepSeek联合昇腾推出的一体化方案,已在北京银行、龙岗区政府、招行等40余家机构上线,覆盖智能客服、文档审核、政务咨询等场景;AI游戏引擎、低代码生成工具进一步推动UGC生态繁荣。

国产化机遇与挑战并存

针对美国芯片禁运风险,汶生指出:短期看,国产芯片在性能与生态适配性上仍落后于英伟达,企业更依赖云端MaaS服务;长期看,昇腾等国产算力通过“软硬协同优化”正加速追赶。他呼吁行业关注两大趋势:

  1. 推理服务国产化:政务、央企等场景将优先采用国产一体机,而市场化企业则通过阿里云、火山引擎等PaaS服务平衡性能与成本。
  2. 技术路径转型:从“堆算力”转向算法压缩、混合精度计算,推动有限资源下的效能最大化。

部分课件

DeepSeek的技术革命与算力范式重构,标志着AI行业从“军备竞赛”进入“应用为王”的新阶段。随着推理成本降低、国产生态成熟,AI将深入千行百业,成为驱动经济增长的新质生产力。正如汶生所言:“未来不属于最大的模型,而属于最懂场景的AI。”

关于TsingtaoAI

TsingtaoAI聚焦AI Infra、具身智能与大模型解决方案,致力于推动产教融合与校企合作,其开源技术与行业洞察已成为AI从业者的重要参考。

目录
相关文章
|
8月前
|
传感器 人工智能 算法
场景入选|TsingtaoAI基于DeepSeek的具身智能实训入选河北省垂直大模型应用场景名单
河北省网络社会组织联合会正式公布《垂直大模型应用场景征集结果名单》,TsingtaoAI自主研发的“基于DeepSeek的具身智能高校实训解决方案——从DeepSeek+机器人到通用具身智能”成功入选河北省15个标杆应用场景。这一成果标志着TsingtaoAI在具身智能与大模型融合领域的技术创新与落地能力获得政府及行业权威认可,同时也为人工智能技术与实体产业深度融合提供了可复制的示范案例。
252 0
|
9月前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|模拟AI场景课程——某汽车厂商
4月18日和19日,东北某市,TsingtaoAI团队为某汽车厂商的智能驾驶业务和研发团队交付“模拟AI场景课程”。本课程基于该厂商在AI领域的战略布局,结合汽车行业智能化转型趋势,以“场景化、实战化、前瞻性”为核心,聚焦AI技术从理论到落地的全链路。通过模拟真实业务场景(如智能座舱优化、智能制造、自动驾驶仿真),帮助学员掌握AI基础能力,并快速应用于研发、生产、营销等环节。
374 4
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
TsingtaoAI亮相2025青岛西海岸科技成果对接会,以具身智能实训赋能AI人才培养
3月26日青岛——由青岛市科学技术局指导、青岛西海岸新区管委联合上海技术交易所等多家机构主办的“2025青岛西海岸新区科技成果对接会”在青岛金沙滩蓝海御华酒店盛大启幕。青岛市委常委,西海岸新区工委书记、区委书记孙永红,青岛市科学技术局副局长张栋华和上海技术交易所总裁颜明峰等参加会议并致辞。TsingtaoAI受邀参会并发表主题分享,公司负责人汶生以《基于DeepSeek的具身智能实训》为题,向与会嘉宾展示了AI具身智能技术如何突破传统边界,助力AI人才从实验室走向产业一线。
302 1
|
9月前
|
人工智能 大数据 BI
DeepSeek-R1模型全栈开发与部署实战培训高级研修班
掌握DeepSeek-R1模型从本地部署到工业级落地的全栈技术能力,包括环境配置、模型微调、推理优化及AI Agent开发等核心环节,能够独立完成基于RTX 4090的模型全生命周期开发任务。通过真实场景案例与全链路项目实战,培养将大模型技术转化为教育、企业服务等垂直领域解决方案的能力,涵盖需求分析、性能调优及工程化部署等关键技能,满足学术研究与产业落地的双重需求。
206 0
|
10月前
|
机器学习/深度学习 人工智能 算法
模型即产品:万字详解RL驱动的AI Agent模型如何巨震AI行业范式
未来 AI 智能体的发展方向还得是模型本身,而不是工作流(Work Flow)。像 Manus 这样基于「预先编排好的提示词与工具路径」构成的工作流智能体,短期或许表现不错,但长期必然遇到瓶颈。这种「提示驱动」的方式无法扩展,也无法真正处理那些需要长期规划、多步骤推理的复杂任务。下一代真正的LLM智能体,则是通过「强化学习(RL)与推理(Reasoning)的结合」来实现的。
642 10
模型即产品:万字详解RL驱动的AI Agent模型如何巨震AI行业范式
|
9月前
|
人工智能 新能源 BI
关于举办"2025年第五届全国大学生技术创新创业大赛"的通知
大赛已连续举办四届,举办以来大赛始终以“创新驱动,赋能就业”为目标,促进学生的创新创造能力,普及创新创业知识,拓宽就业创业渠道,挖掘创新人才,培育多元化的未来产业推进力量。自开赛以来,赛事受到百余所学校关注,十几所高校已立项,参赛人次达上万人,征集优秀商业计划书上千余份。本届新赛事将继续全面贯彻党的二十大精神,完整、准确、全面贯彻新发展理念,加快构建新发展格局,以传统产业的高端化升级和前沿技术的产业化落地为主线,以创新为动力,第五届赛事将开展优秀项目落地北京计划。
2673 4
|
10月前
|
机器学习/深度学习 人工智能 安全
一篇关于DeepSeek模型先进性的阅读理解
本文以DeepSeek模型为核心,探讨了其技术先进性、训练过程及行业影响。首先介绍DeepSeek的快速崛起及其对AI行业的颠覆作用。DeepSeek通过强化学习(RL)实现Time Scaling Law的新范式,突破了传统大模型依赖算力和数据的限制,展现了集成式创新的优势。文章还提到开源的重要性以及数据作为制胜法宝的关键地位,同时警示了业务发展中安全滞后的问题。
1382 176
一篇关于DeepSeek模型先进性的阅读理解
|
9月前
|
机器学习/深度学习 人工智能 算法
师资培训|DeepSeek⼤模型与具⾝智能专项技术培训成功举办
2025年4月北京——工业和信息化部电子工业标准化研究院联合北京博创鑫鑫教育科技和TsingtaoAI,于2025年4月11日至14日在北京成功举办“人工智能从业人员‘应用集成设计开发工程师’暨DeepSeek大模型与具身智能专项培训”。本次培训吸引了来自全国高等院校、科研机构及企业的近20多名教师、科研人员和研究生参与。
235 4
|
存储 人工智能 API
(Elasticsearch)使用阿里云 infererence API 及 semantic text 进行向量搜索
本文展示了如何使用阿里云 infererence API 及 semantic text 进行向量搜索。
548 8
|
前端开发 JavaScript API
探索HTML中的元素关系:父元素、子元素、祖先元素与后代元素
探索HTML中的元素关系:父元素、子元素、祖先元素与后代元素
981 4