科技云报道:AIGC掀算力需求革命,边缘计算将不再“边缘”

简介: AI算力瓶颈下边缘计算崛起

科技云报道原创。

随着以大模型为代表的AIGC时代拉开序幕,算力需求持续爆发,AI与边缘深度融合已是大势所趋,越来越多的企业开始积极布局GenAI。

GenAI技术的商用化部署和应用成为企业竞逐的新阵地,勾勒出大模型从“技术力”转向“生产力”的新生态。

算力就是生产力,更丰富的算力资源成为人工智能竞争的核心基石。

IDC预计,全球AI计算市场规模将从2022年的195亿美元增长到2026年的346.6亿美元,其中GenAI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。

GenAI计算占整体AI计算市场的比例将从4.2%增长到31.7%。
ff0469d7aade48cca19414e37854685c_1534913504.png

AI算力瓶颈下边缘计算崛起

随着AI大模型爆发,大模型迭代和训练所需的算力呈指数级增长。同时,单个AI超算规模也受到功耗、土地、散热等因素制约,算力供给与需求的缺口持续放大。

此前,ChatGPT官网一度停止Plus付费项目的购买,GPT-4推出之后也已多次下调付费用户访问限制,原因是访问量激增超出了服务器的承受能力。

随着这场GenAI热潮逐步扩张,算力短缺已成为行业面临的共同挑战。

如果说传统算力是AI大模型的筋骨,那么边缘算力就是遍布全身的神经系统。

英伟达指出,为了有效运用算力达成AI应用目标,大规模数据中心势必要增加资本支出以扩大云端运算效能,同时也将带动边缘设备的销售。

在AI向实际场景落地的过程中,边缘算力的重要性将加速凸显。未来的AI运算将呈现出“训练与迭代在云端、推理与内容生产梯度分布(云侧+雾侧+边缘侧)”的格局变化,边缘算力有望成为AI算力的重要组成部分。

相较于传统云端,边缘计算作为一种分布式计算架构,具有低延迟、高安全性、高可靠性、保护用户隐私等优势,其在实时决策在自动驾驶、医疗保健、金融、制造等各个领域都至关重要。

从效率方面看,边缘计算使GenAI模型能够在边缘处理数据,从而显着减少延迟并实现更快洞察。这意味着可以实时做出关键决策,从而提高运营效率、增强客户体验和更好的整体业务成果。

其次,通过利用边缘计算,企业可以在边缘设备网络上分配计算负载,从而优化资源利用率并有效扩展。这种方法最大限度地减少了集中式云基础设施的压力并优化了带宽使用,从而节省了成本并提高了性能。

第三,通过边缘计算,GenAI模型可以直接在边缘设备或本地服务器上运行,最大限度地减少将敏感数据传输到集中式云服务器的需要。

通过使数据更接近其来源,公司可以显着降低与数据泄露、未经授权的访问和合规性问题相关的风险。

从关系上看,边缘计算并不寻求取代云计算,相反是对其重要的补充。边缘计算和云之间的协作可实现混合架构,最大限度地发挥两种范式的优势。

GenAI模型可以利用云的可扩展性和存储功能,同时受益于边缘设备的低延迟和本地处理能力。这种融合确保了GenAI采用的多功能且适应性强的基础设施。

边缘计算重构生产力边界

随着企业开始越来越多地拥抱AI,边缘计算和AI的融合拥有改变全球行业的巨大潜力。通过利用本地化处理、实时洞察和优化的资源利用,可以充分释放AI的全部潜力,同时保护敏感数据并推动组织进入AI时代。

对此,全球科技巨头开始将目光越来越多地转向这一领域。

比如,华为、高通均推出边缘AI产品。去年3月,高通中国在安卓手机上首次演示了模型参数超过10亿的Stable Diffusion;华为于去年7月发布智慧搜图功能,该功能通过对模型进行小型化处理。

华为与高通一定程度上验证了高性能边缘AI的可行性,并且表明通过模型压缩+联网智能的方式有望在边缘端实现AI大模型的体验。

此外,英伟达黄仁勋也表示,人工智能的下一个浪潮将是具身智能。具身智能能够在物理世界中进行操作和感知,输出各种机械动作。

具身智能将边缘算力需求提升到了一个新高度,具身智能的“大脑”不仅要处理视觉信息、生成提示词,更要负责输出指令来执行机械动作。在移动芯片无法满足所需算力的场景下,边缘IDC将是算力的有效补充措施。

AIPC、AI手机、具身智能、自动驾驶等AI新应用的兴起,无疑为边缘云市场带来了巨大影响,这种影响既体现在市场规模的扩张,也反映在技术要求的提升方面。

AIPC、AI手机作为AI普惠的终端,其本质在于云端与本地端的混合协作,通过利用云端的大数据处理能力来丰富本地设备的使用场景。

这种混合协作模式对云计算的性能和稳定性提出了更高的要求,同时也为云计算带来了更多的数据处理和存储需求。

边缘云作为离用户最近的数据处理中心,能够迅速响应这些需求,提供低延迟、高带宽的数据处理服务。

具身智能和自动驾驶的发展,更是推动了边缘云市场的快速增长。智能机器人需要在真实的物理环境下执行各种任务,这就需要边缘云提供强大的实时计算能力和数据交互能力。

不仅如此,边缘AI应用场景仍在持续丰富。边缘云服务提供商Zenlayer技术专家表示,对于实时性要求极高的应用,如自动驾驶和智能制造,边缘计算能够提供毫秒级的低延迟响应。

通过在车辆或生产线上部署边缘计算节点,客户可以实时处理传感器数据,进行决策和控制,从而确保安全和高效的生产运行。

其次,对于需要处理大量数据的应用,如智能视频监控和智慧城市,边缘计算能够减轻中心云的压力,实现数据的本地化处理。

通过在摄像头或传感器附近部署边缘计算设备,可以对视频流进行实时分析,识别异常事件,并及时进行响应。

此外,边缘计算还能够解决大模型在数据传输和隐私保护方面的问题。通过将模型推理过程放在边缘端进行,可以减少数据传输量,降低网络带宽要求,同时保护用户数据的隐私和安全。

事实上,目前已有企业开始探索边缘计算在AI大模型中的应用。

据Zenlayer技术专家介绍,某家专注于大模型技术的初创企业基于Zenlayer提供的一整套SDN解决方案,通过智能路由和数据传输协议优化等手段,搭建了一条高效稳定的数据传输通道,确保大模型在训练、推理等关键环节都能获得及时、准确的数据支持,从而显著提升了模型的应用效果和用户体验。

此外,还有对于一些AI大模型客户希望将算力资源部署至海外,Zenlayer针对这类需求,提供了算力托管或算力租赁服务,将计算资源部署在靠近用户的边缘数据中心,使大模型推理能够在本地进行,极大地降低了数据传输的延迟和成本。

同时,Zenlayer还为客户提供了一系列数据本地存储和传输方案,在满足各个国家对数据合规要求的同时,尽量优化业务交互体验。

结语

如果把视线放得更长远,在AI等众多颠覆性技术的背后,总离不开边缘计算的存在。当全球都沸腾在AIGC的风潮里,边缘云服务商正通过边缘端和云边的融合协同,满足更多元的AI应用场景,以更自如的算力,让AI技术更自如地普惠。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关文章
|
8月前
|
机器学习/深度学习 人工智能 算法
AIGC时代的算力基石,未来的数据平台将如何演进?
智能化是数字化的延伸,数据是AI的基石,AI需要借助数据更好地为社会、商业以及每一个人提供服务。基于AI的数据库将逐步演化为一站式的数据平台,这其中蕴含着巨大的商业价值。
536 26
|
5月前
|
存储 弹性计算 编解码
阿里云赵大川:弹性计算推理解决方案拯救AIGC算力危机
阿里云弹性计算高级技术专家赵大川在【人工智能基础设施】专场中带来了题为《弹性计算推理解决方案拯救AIGC算力危机》的主题演讲,围绕弹性计算推理解决方案DeepGPU实例如何支持Stable Diffusion文生图推理、Stable Diffusion推理演示示例等相关话题展开。
69930 205
|
4月前
|
传感器 边缘计算 人工智能
探索未来科技融合之路:人工智能、物联网与边缘计算的前沿技术趋势
随着科技的迅猛发展,人工智能、物联网和边缘计算等前沿技术正逐渐渗透到我们的生活中。本文将深入探讨这些技术的最新趋势,展望它们在未来的潜在应用,以及如何融合发挥更大的作用。
214 0
|
4月前
|
人工智能 边缘计算 物联网
未来科技驱动力:探索人工智能、物联网与边缘计算的前沿趋势
在快速发展的数字时代,人工智能、物联网和边缘计算成为引领创新的关键技术。本文将深入探讨这些前沿技术在不同领域的应用,包括智能家居、智慧城市、工业自动化等。同时,我们将分析它们所带来的机遇和挑战,并展望未来的发展方向。
|
4月前
|
机器学习/深度学习 存储 人工智能
AIGC机遇下的算力挑战
【1月更文挑战第13天】AIGC机遇下的算力挑战
44 4
AIGC机遇下的算力挑战
|
4月前
|
人工智能 边缘计算 物联网
未来科技的崛起:人工智能、物联网与边缘计算引领前沿技术趋势
在当今日益数字化的世界中,前沿技术的快速发展成为推动社会进步的重要力量。本文将聚焦于三个主要前沿技术领域:人工智能(AI)、物联网(IoT)和边缘计算(Edge Computing)。我们将探讨这些技术的定义、应用领域以及对未来社会、经济和生活方式的潜在影响。
|
4月前
|
机器学习/深度学习
AIGC为产品外观设计带来革命
【1月更文挑战第6天】AIGC为产品外观设计带来革命
59 1
AIGC为产品外观设计带来革命
|
5月前
|
存储 人工智能 缓存
探索AIGC未来:CPU源码优化、多GPU编程与中国算力瓶颈与发展
近年来,AIGC的技术取得了长足的进步,其中最为重要的技术之一是基于源代码的CPU调优,可以有效地提高人工智能模型的训练速度和效率,从而加快了人工智能的应用进程。同时,多GPU编程技术也在不断发展,大大提高人工智能模型的计算能力,更好地满足实际应用的需求。 本文将分析AIGC的最新进展,深入探讨以上话题,以及中国算力产业的瓶颈和趋势。
|
5月前
|
边缘计算 人工智能 监控
Neousys宸曜科技强固型Jetson AGX Orin边缘计算平台,赋能视觉边缘计算AI推理应用
工业级强固型嵌入式平台厂商Neousys宸曜科技发布了新的NVIDIA Jetson无风扇嵌入式计算平台NRU-220S系列。NRU-220S系列搭载了Jetson AGX Orin 32GB/ 64GB系统模块(SOM),并以一系列综合的工业设计体现了Neousys宸曜科技的强固DNA,不仅能提供高达275(具有稀疏性)INT8 TOPS人工智能算力,还支持-25°C至70°C宽温范围运行,非常适用于部署在路侧、车载、食品生产线或多粉尘环境的工厂,用于智能视频分析、监控或检测应用。
|
7月前
|
机器学习/深度学习 人工智能 算法