《云栖战略参考》由阿里云与钛媒体联合策划,呈现云计算与人工智能领域的最新技术战略观点与业务实践探索,希望这些内容能让您有所启发。
曾经,云计算被当作IT的一部分,它的出现是企业信息化建设升级和替代的一个方案。而现在,IT是云计算的一部分。这一转变的根源在于云计算范畴的不断扩大——现代广义的云计算不仅覆盖了从最底层的芯片指令集,到网络存储、云主机、云服务器,还包括云原生架构、微服务、大数据、数据库、容器化部署、K8S、Serverless架构,乃至视频云处理、大型网络数据中心的调度,以及人工智能大模型的训练和推理。这些能力远超过了云计算最初的设想和范畴。今天,广义的云计算结合了高效的数据处理和人工智能技术,已经不仅局限于IT战略层面,更上升为企业的核心战略。
在云计算领域,可以确立两个重要的论断。第一,未来云计算一定是企业和开发者的首选。这是因为传统的企业软件开发需要经历漫长的周期,依赖大量底层基础设施、技术资源以及物理和网络资源的支持。相比之下,云计算环境提供了即时获取这些资源的能力,达到了开箱即用的便利性。公共云服务为开发者和企业应用提供了性价比极高的解决方案,显著缩短了创新所需时间。
第二,未来技术创新一定优先诞生在云上。在过去两年中,大模型等技术在全球范围内迅速兴起,与云计算的结合如同鱼水关系,彼此为最佳拍档。未来,不仅限于人工智能应用和技术,许多软件的开发和新型软件也同样将优先在云上诞生。云计算将成为新技术诞生、发展的重要源泉。
在企业的转型与发展进程中,云计算无疑发挥着至关重要的作用。以中国新能源汽车产业为例,该行业已大步走向国际市场。这一领域的差异化竞争力主要体现在车联网与自动驾驶技术上,而这两项技术的实现,依赖于云计算、大数据和人工智能的深度融合。电子商务领域经历了从货架电商到兴趣电商,再到直播电商的演变,而在这些变革中,视频云、转码等技术发挥了显著的推动作用。同样地,在众多企业的搜索、推广和广告活动中,大数据的分析、运营,包括预测和决策支持已经成为企业新型的商业变现工具。
这些变化均凸显了一个事实:传统的IT定义已显得狭窄,云计算所能提供的功能和价值更为广泛。云计算不仅能够帮助企业构建完整的技术架构,还能促进业务创新、优化业务流程,拓展全球化布局,并实现全球范围内的无缝连接。
除了提升IT能力、运维能力和开发能力,云计算还显著降低了开发成本,使得软件开发和AI创新的时间成本大幅下降。在美国及其他西方国家,基于云服务的新兴SaaS公司的成功速度远超几十年前,云计算已经成为企业成长和拓展市场的加速器。
云计算的七大价值点
今天,由AI加持并面向AI架构的云计算,为企业发展带来了更全面的价值,七个字概括为:进、智、拓、省、捷、才、弹。
(1)进:架构致简,从独立散点到统一建设
云计算为企业提供更先进的现代化架构,帮助企业向世界级的先进架构演进。
在中国,许多非互联网企业和传统大型企业的IT系统建设周期长达数十年,采用了各种技术栈、产品和软件来构建其业务系统,导致形成了众多烟囱式、竖井式的系统。这不仅使得业务系统相互隔离、缺乏通信,还有可能对相似类型的业务部署了不同的技术栈和运维体系,增加了不必要的运维管理成本。想象一个场景,无数的烟囱背后架设着错综复杂的电线杆,电线相互缠绕,构成一个庞大复杂的网络。在这种情况下,提升企业的整体效率、完成IT的统一治理、实现资源的统一运维管理将是一个巨大的挑战。
今天,云计算所提供的一个重要价值在于,帮助这些企业从这种分散、难以管理、多样化的技术栈架构转变为统一运维、统一资源管理的现代化架构。现代化架构也支撑着企业业务的稳定运行。今天许多面向互联网的企业已经发展至全球化规模,为全球客户提供订单式和交易式服务。企业面临大规模高并发需求、业务连续性和数据一致性方面的挑战,企业必须将自身的架构升级至类金融级别的现代化架构,才能满足未来发展的需求。单元化、多地多活、在线离线混合部署、容器化调度,及数据的强一致性,这些构成了现代化架构的重要特征。
(2)弹:更细致、稳定地应对分钟级波动的业务
弹性计算是云计算的核心技术之一,它代表着云服务提供商根据客户需求动态调整计算资源的能力。在实际业务场景下,企业常常面临业务量的时间波动,尤其是在面对需求峰谷变化时,弹性计算的能力成为了关键的支持。在某些场合,弹性计算的作用尤为关键。
以今年春节期间的12306为例,该平台单日最高售票量超过2000万张。售票过程包括了一系列复杂的交易环节,例如余票查询、下单、交易确认等。面对节假日的流量高峰,12306需要极强的弹性伸缩能力应对激增的用户请求。而云计算实现了每分钟3万核的弹性伸缩能力,这相当于在一分钟内能够迅速增配超过300台高配置的服务器资源。
(3)捷:让数据价值成为业务创新动力
尽管云计算的潜力仍未被充分开发,但它在大数据处理方面所展现的能力已经远远超越了传统线下部署的开源方案。在中国,企业正在经历数字化转型,从互联网和金融行业扩展到餐饮业甚至街边奶茶店,各种规模的企业都在逐步成为数据驱动型的组织。
企业对数据的运用已由最初的业务智能(BI)发展至运营分析,进而演化为今日的精细化运营和数据中台建设。在这个过程中,数据能力、技术和产品持续进化。大数据领域的开源技术发展飞速,从BI到Hadoop、Spark、Flink以及湖仓一体和流批一体等技术,都是为了满足企业日益精细化的业务需求而发展起来的。
过去,大数据分析主要服务于用户分析平台,尚未真正影响业务发展。而现在,随着互联网企业在搜索、推荐、广告等领域背后所依赖的强大数据计算平台,数据分析、计算和治理不仅作为决策支持工具,更已成为实现商业价值转化的手段。
对于众多企业而言,线下构建大数据平台是极具挑战性的。这需要众多专家掌握复杂的技术栈,而这在现实中几乎是不可行的。而云端的大数据能力不止于传统Hadoop的计算,它包括数据存储、治理、迁移,以及实时计算、流批一体和湖仓一体等技术,这些在云端已经形成了完整的技术栈,并可以实现与线下Hadoop体系的无缝对接和迁移。
目前,越来越多企业选择在云端构建大数据平台,不仅利用云计算提供的基础设施,还采用云上的数据治理、应用和标签能力,并结合大数据和AI的先进计算技术。未来,云端构建的大数据平台预计将为企业提供巨大的价值。
(4)拓:加速全球业务布局
在全球化浪潮的推动下,中国企业纷纷将目光投向海外市场,在游戏、消费电子、电子商务、新能源汽车等多个领域取得了引领国际乃至世界的地位。海外扩张成为企业发展的必然选择,但在国外落地时,企业往往面临着失去国内市场优势的挑战,如有限的营销资源、网络基建和人才支持,这使得复制国内成功模式在海外变得复杂困难。此外,构建与国内同等水平的基础设施存在重大挑战,战略布局也充满了不确定性。
在此环境中,云计算及其公共云服务商为中国企业的海外成功提供了有效支持。无论是进行初步的市场测试,还是展开大规模部署,云服务都是关键助力。为了满足这些需求,云服务商必须具备以下关键能力:稳定的全球基础设施网络、可靠的合规和安全保障、专业的服务支持。
(5)智:大模型时代,云计算是AI的最佳拍档
大模型在当前科技领域已成为备受瞩目的焦点,而云计算在支持大模型方面的作用远不止于提供算力。从阿里云的角度来看,云计算在AI大模型创新方面提供了三个层面的服务能力。
首先是建模型。阿里云通过提供丰富的多元算力、融合调度,助力企业进行大模型的训练与推理。大模型对云计算平台的要求很高,涉及的服务远超出提供GPU服务器那么简单。对于网络存储系统的优化尤其关键,这是构建面向AI的云架构的必要条件。AI的兴起促使整个技术架构必须迭代、升级,甚至重新设计,尤其是网络架构。
其次是调模型。阿里云致力于构建类似HuggingFace这样的平台,以便通用的大模型以及国内外开源的大模型都能在其云平台上调用,实现如RAG、Agent等模型的应用。阿里云旨在建立一个更为开放的大模型联合工作平台。
最后是用模型。中国在过去一年中经历了所谓的“百模大战”,而未来的竞争可能收敛到“十模大战”,其中生存下来的将是那些能够商业化和大规模部署的企业。
许多中国企业需要大模型的能力,但他们无需自行进行推理训练或购买昂贵的算力,而是可以直接在云上获取这些能力,从而提高内部办公效率和对外的营销能力。这才是大模型未来的核心应用。通过阿里云开发的通用大模型,提供API接口,以便更多企业可以结合自己的业务场景进行调用,优化业务流程和提升效率。
大模型的发展尽管仅有短短的一年多历史,却已经开辟了一个新局面。云计算提供的能力在AI大模型方面愈发显著,不仅包括面向未来AI架构的云上推理训练平台、云上模型协作平台,还包括帮助客户通过通用模型提升企业实力的服务。在大模型的时代,云计算与AI已经成为最佳搭档。
(6)省:大幅压缩供应、建设、创新的时间成本
成本问题在云计算领域是一个永恒的讨论主题。尽管许多文章对比了云计算与IDC或自建环境的成本差异,但他们常常忽视了时间成本这一关键因素。在评估云计算与传统IDC的区别时,时间成本成为一个显著的区分点。在传统的IDC或自建环境中,从设备采购到部署再到测试的整个流程都需要一个漫长的时间周期,涉及到的各个阶段包括采购周期、开发周期、部署周期、测试周期以及资源部署和扩缩容的周期,通常以日、周甚至年为计量单位。相对而言,云平台上的所有服务和资源都是开箱即用的。用户可以立即访问经过测试且高度支持的基础设施与服务,这极大地提升了企业的运营效率。
在中国,许多开发者利用开源软件进行开发,但在缺乏高性能、高可用性资源环境的情况下,这些开源系统难以真正投入生产使用。云计算为开源生态提供了一个稳定而高效的运行环境,使得云平台成为开源软件的理想载体。通过避免长时间的采购、测试、开发周期,云计算不仅可以为企业节省巨额成本,而且还能促进业务创新。
(7)才:改善企业人才架构
云计算技术的应用正转变着企业的运营模式,它使得技术团队得以摆脱对传统基础设施的持续维护。这种转变不仅优化了企业的IT治理结构,还改善了人才架构,允许专业人员将精力集中于应用开发和人工智能能力的建设。
全栈上云,适应市场波动的灵活资源配置策略
许多企业选择全栈上云是为了响应市场需求的不断变化,特别是在业务需求存在显著起伏和高峰期的情况下。公共云提供了灵活组合常态化资源和弹性资源的能力,允许企业根据实际业务波动来定制资源配置,从而更加高效和经济地应对变动。相比之下,传统的IDC由于其固定的硬件资源和网络带宽,往往无法灵活适应业务的发展需求。
在云上,服务器资源的配置并非与线下服务器1:1对应。例如,原本线下需部署1000台服务器的业务,迁移到云端后可能只需要500台常态化服务器配合300台弹性资源即可。这样的“5+3”配置模式更为高效,能够在保障业务运转的同时降低成本。系统运行在云上的虚拟机或容器化环境中,通过提高运维效率并利用PaaS层的能力,能够进一步优化系统性能。
云计算的效率不仅仅是硬件数量上的直接对比,更是包括软硬件一体化技术、虚拟化开销减至最低、PaaS层能力加持,以及云原生技术和容器化部署的综合优势。这些技术相结合,能够显著提高系统运行的效率。
过去,通常讨论的是“搬站”,即迁移物理服务器到云端。然而,目前的趋势更应当是“搬栈”,它意味着迁移整个技术栈至云端,以充分发挥云计算的潜力。在这个过程中,云计算与IDC的关系已经超越了服务器本身,而是扩展到了资源池管理、计算、存储、人工智能等更高层次的能力。