大家之言|人工智能发展趋势与基础设施建设之路

简介: 中国AI技术发展已从跟跑转向基建领跑,“十四五”期间算力规模年均增速达27%。杭州城市大脑升级AI智能体集群,重庆部署超大城市治理系统,宁夏作为“东数西算”枢纽持续突破算力规模。专家梅建平指出,人工智能虽为核心驱动力,但需警惕过度期望,理性看待其局限性。国家提出“三步走”战略与“一体两翼”规划,推动算力基础设施建设,如“东数西算”和全国一体化算力网,以优化资源调度并促进数字经济高质量发展。

在浙江,杭州城市大脑依托475项实时体征监测系统,正升级为AI智能体集群;在重庆,基于通义千问大模型的三级治理中心系统,部署1362万个城市感知设备,打造超大城市治理样本;在宁夏,作为“东数西算”的重要枢纽,已建成9个大型数据中心,算力规模持续突破......这些场景印证着中国AI技术发展已从技术跟跑转向基建领跑——“十四五”期间我国算力规模年均增速达27%,在这场智能革命中,中国正以全新模式重构全球人工智能基础设施版图。

AI技术的跃迁式发展与中国算力布局息息相关。近日,中国信息协会算力网专委会主任、工信部电子科技委委员梅建平在阿里巴巴杭州全球总部作《人工智能趋势与基础设施建设》专题分享,从人工智能的起源到中国算力体系建设的展望,详细解析了当前阶段人工智能发展趋势与基础设施建设之路。


640 (33).png


人工智能的起源和发展,期望膨胀及预言中的AI

1950年,数学家艾伦·图灵提出“图灵测试”,首次定义了机器智能的标准:若人类无法通过对话区分机器与真人,则机器具备智能。这一理论为AI研究奠定了基础。与此同时,计算机科学先驱冯·诺依曼提出了计算机架构模型。


1956年的达特茅斯会议成为AI诞生的标志性事件,约翰·麦卡锡等科学家正式将“人工智能”确立为独立学科,他们满怀信心地预测,机器将在20年内完成人类能做的任何工作。


人工智能的早期发展充满了高涨的期望和乐观的预测,到了20世纪70年代,由于缺乏实质性突破,加上面临技术瓶颈,人工智能领域进入了第一次“AI寒冬”。在这一时期,资金减少,研究进展放缓,社会和学术界对AI的热情明显降温。这一挫折表明,创造真正的人工智能远比最初想象的更为复杂和困难。


21世纪初,随着计算能力的提升和数据量的爆炸性增长,深度学习技术取得了显著突破。2006年,杰弗里·辛顿等人在训练深层神经网络方面取得了关键进展,为深度学习的兴起铺平了道路。随后,深度学习模型在图像识别、语音识别和自然语言处理等领域表现出卓越性能。


2018年,OpenAI提出GPT(Generative Pre-trained Transformer),即大语言预训练模型,通过在大规模文本数据上预训练,实现跨领域语言生成。2020年,BERT(Bidirectional Encoder Representations from Transformers)进一步推动自然语言处理(NLP)的突破,全世界对人工智能再次寄予了极大的期望。


对于现状的人工智能热潮,梅建平主任提到,人工智能是新一轮科技革命和产业变革的核心驱动力,但不能对它寄予过多、过高的期望。需要警惕对技术大模型、算力无所顾忌的投入,人工智能到现在为止还不是万能圣杯,什么问题都可以解决,它依然属于计算机技术的范畴,需要脚踏实地地提升核心实力。


梅建平主任认为,当前AI距离通用人工智能(AGI)仍有较大差距,如文生视频经常出现细节性bug,Deepseek也会一本正经地说错话,这种现象被称为“大模型的幻觉”。从大模型的工作原理来说,大模型错误的话是幻觉,正确的话也是幻觉。大模型成功的本质是「有多少人工,就有多少智能」,人工指的是人类千年来对知识的积累(如语言、图像数据、互联网技术等),大模型的输出并非源于理解,而是对训练数据中模式的概率推断。


2025年初,马斯克率领几百个科学家写了一封公开信,呼吁人工智能的发展要停止半年,否则会对人类造成威胁。对此梅建平主任表示:“天行有常,不为尧存,不为桀亡,技术发展是自然规律,我们需理性看待而非恐惧。


新一代人工智能发展规划  ,“三步走”战略及“一体两翼”规划

1986年,国家启动863计划,首次将信息技术列为国家战略重点。2017年,国家将人工智能列为重大科技专项,提出“三步走”战略。

  • 第一步(至2020年):‌实现人工智能技术与应用水平与全球同步,成为新经济增长点,重点布局技术标准体系和产业生态链,培育国际领先企业。
  • 第二步(至2025年):基础理论取得重大突破,部分技术达到世界领先水平‌,推动产业升级与经济转型,核心产业在智能制造、智慧城市、智能医疗等领域广泛应用。
  • 第三步(至2030年):‌总体技术水平全球领先,成为世界主要人工智能创新中心,形成覆盖技术研发、系统集成到应用落地的完整产业链,支撑我国迈入创新型国家前列。


“三步走”战略由科技部主要组织实施,同时还设有“一体两翼”规划,即以计算机技术和软硬件基础为核心,辅以基础理论研究和应用示范,推动人工智能领域的全面发展。


梅建平主任分析,任何一次科技革命,如蒸汽机、发动机发明的背后均有能量转换、热力学原理及机械动态等方面的理论基础支撑,而人工智能的发展仍然缺乏体系化的底层科学框架,需要在算力算法、认知机理等核心领域构建理论支撑。针对国内人工智能发展现状,梅建平主任坦言,经过过去五年的政策驱动,我们在人工智能方面取得了显著进展,论文、视频技术和专利方向表现得尤为突出,但行业存在“百模大战”现象,需要警惕大模型的低水平重复建设,避免资源浪费。


算力发展新基建,超算互联网、东数西算及全国一体化算力网

超算互联网的诞生:从攀高峰到建高原

梅建平主任指出,数据是人工智能的燃料,算法能实现从数据中提取规律并总结结果,而算力极大支撑了人工智能的发展,是数字经济时代的“新生产力”。

863计划之后,中国在计算机技术,特别是超级计算机领域取得了显著进展。初期通过跟踪国际先进技术,到后来自主研发芯片和核心计算技术,中国在超算领域实现了从无到有。2002年之后,天河一号、天河二号等超级计算机在国际超算排名中表现优异,取得了领先水平。面对人工智能行业对算力的更高要求及日益白热化的国际竞争格局,“超算互联网”战略诞生,该战略旨在整合国内14个超算中心资源,实现跨区域协作,成为支撑数字中国建设的“高速路”。

梅建平主任表示,过去我们追求的是技术上的高峰,现在更多需要回归到产业应用的维度,让技术创新真正转化为生产力提升。


从“东数西算”战略到全国一体化算力网

据IDC研究显示,全球算力指数与GDP增长存在显著关联,算力指数每提升1%可带动GDP增长0.35%。算力不仅是人工智能发展的核心支撑,更深度赋能农业气象预测、重大科研攻关等领域。为应对算力资源供需矛盾,我国推出"东数西算"战略。

起初,“东数西算”战略并非直接针对算力本身,而是考虑到电动车和IC产业在中心城市对电力的巨大需求,导致这些城市难以承受,因此提出了将算力设施迁移到西部或气候较凉爽地区的设想,以减少制冷用电。考虑到数据主要集中在中心城市,“东数西算”的战略目标随后延伸为通过云网融合技术实现高通量、大带宽、低延迟的网络传输。

梅建平主任强调,算力不能像电力直接传输,但可以通过数据调度实现资源优化,像电网一样构建全国互联。我们的最终目标是建立全国一体化算力网,让用户使用算力时像用电一样方便。


算力体系建设的挑战及展望

目前,很多研究机构都提出了各自的算力网络结构,但算力体系的构建仍然存在一定复杂性,如算力枢纽定位不清晰、资源调度难度大、能源成本高、网络延迟问题及技术标准不统一等问题,尤其是在算力节点互联方面,尽管国内已有一定数量的互联节点,但目前还并未实现真正意义上的计算互联。

从全球趋势看,各国将算力视为人工智能和数字经济的核心基础设施,美国、欧盟等已启动大规模投资计划。梅建平主任指出,国内算力投资出现的散、乱、效益不高现象,需要窗口化指导及加强顶层设计,统筹解决算力投资分散、重复建设等问题。

梅建平主任表示,我们的目标是通过推动技术标准落地、促进绿色能源应用、深化国际技术合作等举措,共同促进算力网络技术的多行业创新,最终实现算力资源的协同调度与高效服务。


作为全球领先的云计算和AI科技公司,阿里云持续关注全球人工智能技术演进趋势,并通过长期投入和战略布局,逐步构建了从基础研究到产业应用的全链路能力。未来,阿里云将继续以硬件基础设施、云计算、大模型等技术为底座,助力各行业数字化转型,并通过开源、合作、人才培养,构建开放的技术与商业生态。

相关文章
|
6天前
|
人工智能 自然语言处理 IDE
通义灵码 × Qwen3:编程智能体上线
通义灵码现已全面支持Qwen3,正式上线编程智能体。升级后的工具不再只是代码生成器,而是能理解任务的智能搭档,依托Qwen3能力结合MCP服务,自动感知项目结构、分析需求并调用多种工具完成编码任务。通过自然语言输入,开发者可在10分钟内完成原本需1~2天的App开发工作。此外,通义灵码支持工程级变更、自动上下文感知、工具自主使用及终端命令执行,深度集成3000+ MCP服务,覆盖DevOps全流程。目前插件下载量超1500万,累计生成代码超30亿行。体验只需将插件升级至2.5.0版本以上并在VS Code或JetBrains IDE中启用。
69 24
|
6天前
|
人工智能 前端开发 Devops
通义灵码带你玩转开发者常用的MCP(合辑,持续更新中)
今天我们精选了与开发者息息相关和比较热门的MCP 服务,总结了这些技术服务在实际开发的最佳实践,涵盖了从前端开发、后端开发、DevOps、测试、运维等关键环节,及非研发领域中的热度较高的MCP服务。我们通过直播、图文等形式带你了解和学习!
692 3
|
7天前
|
数据采集 自然语言处理 搜索推荐
基于Qwen3的Embedding和Rerank模型系列,开源!
近年来,随着大规模预训练语言模型(LLM)的飞速发展,文本嵌入(Embedding)和重排序(Reranking)技术在搜索引擎、问答系统、推荐系统等多个领域的重要性愈发凸显。
887 78
|
7天前
|
人工智能 Nacos 开发者
Nacos 开源 MCP Router,加速 MCP 私有化部署
Nacos MCP Router 发布全新版本。带来了多项重要更新,包括对 SSE 和 StreamableHTTP 协议的全面支持、Docker 容器化部署方案以及革命性的 MCP Server 协议一键转换功能。文章中详细的介绍更新内容并简单演示了使用过程。Nacos MCP Router 新版本的发布,不仅提升了开发者的使用体验,也为 MCP 服务的广泛应用和生态繁荣奠定了基础,欢迎关注。
275 63
|
6天前
|
开发框架 定位技术 API
AgentScope 与 MCP:实践、思考与展望
AgentScope 作为一款功能强大的开源多智能体开发框架,为开发者提供了智能体构建、工具使用、多智能体编排等全方位支持。
146 27
|
7天前
|
机器学习/深度学习 自然语言处理 测试技术
Qwen3技术报告首次全公开!“混合推理模型”是这样炼成的
近日,通义千问Qwen3系列模型已开源,其技术报告也正式发布。Qwen3系列包含密集模型和混合专家(MoE)模型,参数规模从0.6B到235B不等。该模型引入了“思考模式”与“非思考模式”的动态切换机制,并采用思考预算机制优化推理性能。Qwen3支持119种语言及方言,较前代显著提升多语言能力,在多个基准测试中表现领先。此外,通过强到弱蒸馏技术,轻量级模型性能优异,且计算资源需求更低。所有Qwen3模型均采用Apache 2.0协议开源,便于社区开发与应用。
258 28
|
7天前
|
人工智能 JSON 运维
🚀🚀 【MCP + AI】grafana-mcp-analyzer:基于 MCP 的轻量图表分析助手
`grafana-mcp-analyzer` 是一个开源项目,通过 MCP 协议连接 AI 助手与 Grafana,实现智能分析监控数据。只需简单配置,AI 可快速解读图表,提供性能瓶颈、优化建议等专业分析,极大提升运维效率。支持多种数据源(Prometheus、ES 等),适配 ChatGPT、Claude 等模型,部署轻量,操作便捷。从此告别深夜手动排查问题,让 AI 成为你的智能运维专家!项目地址:<https://github.com/SailingCoder/grafana-mcp-analyzer>
63 1
🚀🚀 【MCP + AI】grafana-mcp-analyzer:基于 MCP 的轻量图表分析助手
|
6天前
|
存储 自然语言处理 Java
《Java开发者必知:LangChain4j实现RAG系统多模型调度的深度剖析》
RAG(检索增强生成)系统通过结合大语言模型与外部知识检索,解决了知识更新和结果准确性等问题。LangChain4j作为Java框架,在构建RAG系统时具备显著优势,尤其多模型调度功能可灵活选择模型,提升性能与适用性。本文探讨如何用LangChain4j实现多模型调度,涵盖模型初始化、注册表构建、动态切换及协作机制,同时解决性能优化、兼容性与数据隐私等挑战,助力开发者打造高效、可靠的RAG系统。
|
6天前
|
人工智能 自然语言处理 语音技术
2025年国内主流智能客服系统:技术架构与能力深度解析
本文分析了2025年国内智能客服市场的技术格局与系统能力,从核心技术栈(NLP、知识图谱、语音技术等)到市场梯队划分,深入探讨了第一梯队的综合型平台和第二梯队的场景化服务。以合力亿捷为例,剖析其端到端AI技术栈、大模型融合、全渠道融合及运营优化能力,并对比国际顶尖通用AI在语义理解、多模态交互和自主学习方面的启示。最后为企业提供选择智能客服系统的五大考量因素,强调技术与业务场景的深度融合,助力企业实现更高效、智能的客户服务体验。
169 2
|
5天前
|
人工智能 分布式计算 大数据
构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践
本文介绍了大数据与AI一体化架构的演进及其实现方法,重点探讨了Data+AI开发全生命周期的关键步骤。文章分析了大模型开发中的典型挑战,如数据管理混乱、开发效率低下和运维管理困难,并提出了解决方案。同时,详细描述了MaxCompute在构建AI时代数据基础设施中的作用,包括其强大的计算能力、调度能力和易用性特点。此外,还展示了MaxCompute在多模态数据处理中的应用实践以及具体客户案例,最后提供了体验MaxFrame解决方案的方式。