云上真有无穷算力吗?

简介: 本文探讨了云计算环境下“算力无限”的误区,指出即使云上硬件资源看似无限,但由于网络延迟、算法模型限制及成本等因素,实际运算效率未必能线性扩展。文章强调了提高单机运算效率的重要性,推荐使用SPL等工具优化算法,以实现更高性能。

自从 Hadoop 兴起之后,业界好象就有了这么一种共识:不再关注单机的运算性能,全靠集群堆。大家都在比谁的集群能更大,至于单机能力是否被充分发挥了,那没人关心。Hadoop 体系的诸多技术都有这个特征,单机性能奇低,但并不妨碍 Hadoop 推广得遍地都是。

发展到云计算阶段,这个认识就变成了“云上算力无穷”,算法有多笨都没有关系了,反正算力无穷多。所谓双拳难敌四手,到了云上,似乎啥都能搞定。

真有这么回事吗?

从云上能提供的硬件数量(CPU、内存)上看,算力确实是无穷的(相对于某个用户的需求),但这个“无穷”真能有多大意义呢?。

云计算的环境也是由普通硬件搭建的,一台物理机器能装上的 CPU 和内存数量都是有限的,再多的 CPU 和内存就需要用多机来组合了,而多机虚拟出来的 CPU 和内存和单机的性能是完全不同的。访问另一台物理机器的内存需要通过网络,而网络只适合批量访问,但内存的使用常常是小量随机式的,如果继续把网络模拟出来的内存当作单机内存去使用,而不调整算法以适应集群的话,那性能下降得会非常离谱。Java 程序员都知道当内存紧张时(还够但不充裕),JVM 要用外存缓存时导致的性能下降会有多严重,常常是一两个数量级的,在集群中发生本机内存不足需要访问其它节点的内存时,也会有类似的现象发生。这意味着,达到某个阈值的时候,你可能要动用 10 倍甚至 100 倍的硬件资源才能在期望的时间内完成运算了。算力虽然“无穷”,但并不能线性地扩展。

这就会引出另一个问题。

数天前与江湖上人称铎神的师弟(参考:https://mp.weixin.qq.com/s/0gFtvoYG-B_yBb1FoAlyHA)一起聊天,问起对“云上算力无限”这个观点的看法,铎神脱口而出:“云上算力无限,但用户口袋里的钱却有限”。

这道理简单得完全无需解释。

再退一步讲,就算用户财大气粗不在乎成本,仍然有不少运算没办法用上无限算力。

比如我们常见的关联运算(SQL 中的 JOIN),如果不在算法模型层面上进行改造,那它会有个集群节点的极限。分布式 JOIN 算法会有个 Suffle 动作,要在节点之间交换数据,当节点数较多时,Suffle 造成的网络延迟会抵消多机分摊计算带来的性能提升,这时候再增加更多的节点,运算性能并不会有明显提升了。而且这个节点限制数并不大,大概也就是几十到百的规模就会到顶了。

如果不对数据存储组织做刻意的优化,这种“关联”运算就会很常见。

从这三方面看,云上的“无穷”算力对于实际要做的运算来讲,常常没有多大实质意义。

需要一架飞机的时候,并不能用十万匹马来对付。

事还没讨论完,我们还要回答一个问题:既然真正意义的无穷算力并不普遍存在,为什么 Hadoop 等对单机资源利用率很低的技术还能大行其道?

这可能是因为 Hadoop 主要采用的是 PC 服务器,其价格远远低于之前的主流小型机,使用集群的总成本常常还比使用单个小型机的成本更低,这就给人造成了错觉,在原先可接受的成本下可以轻易地获得希望的算力。然而,小型机被逐步边缘化、硬件竞争都进入了 PC 服务器时代之后,耗用太多机器资源的技术就会越来越难过了。

那该咋办?

设计好算法,先把单机的运算效率提上去呗。

但是且显然,这事不能全指望数据库的优化,情况复杂时数据库引擎会晕掉(很容易造出这种并不太复杂的例子)。而且,很多运算本身都没法用 SQL 写出来,数据库想优化也无从谈起。

那又咋办?

嘿嘿,用 SPL 啊!

SPL 能够方便实现很多高性能的算法,把单机的运算效率提到极致,整体性能提上几倍甚至几个数量级,本来要用集群的运算也可以不用集群,大集群可以改用小集群。而且,关键的是,写出来的代码比 SQL 还短!

SPL 已开源且免费,欢迎下载试用,乾学院上还有高性能算法图书 【性能优化】。

相关文章
|
芯片 算法 异构计算
如何打破边缘端芯片算力有限的困局?阿里 AILabs 这么做!
在自研硬件上,和芯片厂商深度合作针对中低端芯片做出了特例优化,落地了手势识别、宠物检测和笔尖检测等业务。
3364 0
|
7月前
|
人工智能 异构计算 安全
《百炼成金-大金融模型新篇章》––03.问题1:“有限算力+持续进化的算力”,双重制约下的算力资源
百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。
|
8月前
|
弹性计算 NoSQL 关系型数据库
阿里云大降价,规模效应释放技术红利,这波福利你接不接?
阿里云大降价,规模效应释放技术红利,这波福利你接不接?百款产品直降,平均降幅20%,阿里云希望通过此次大规模降价,让更多企业和开发者用上先进的公共云服务,加速云计算在中国各行各业的普及和发展。这次降价包括云服务器ECS、对象存储OSS、云数据库都降价了,真降价,直降价:百款产品直降,平均降幅20%,阿里云百科分享阿里云2024年降价信息汇总表
|
8月前
|
弹性计算 NoSQL 关系型数据库
规模效应将释放红利,2024年阿里云又降价了!
规模效应将释放红利,2024年阿里云又降价了!百款产品直降,平均降幅20%,阿里云希望通过此次大规模降价,让更多企业和开发者用上先进的公共云服务,加速云计算在中国各行各业的普及和发展。这次降价包括云服务器ECS、对象存储OSS、云数据库都降价了,真降价,直降价:百款产品直降,平均降幅20%,阿里云百科分享阿里云2024年降价信息汇总表
|
人工智能 数据中心 云计算
冷静计算:让每一分算力都更​具价值
冷静计算:让每一分算力都更​具价值
|
机器学习/深度学习 人工智能 城市大脑
【计算讲谈社】第十讲|当云计算遇上碳中和
碳中和的实现是一项复杂的系统工程。在碳中和的大背景下,云计算会和碳中和发生什么碰撞?阿里云【大咖说】全新子系列【计算讲谈社】第十讲《当云计算遇上碳中和》上线,阿里巴巴研究员吴翰清(道哥)携学员展开分享和讨论
283 0
【计算讲谈社】第十讲|当云计算遇上碳中和
|
机器学习/深度学习 人工智能 城市大脑
【计算讲谈社】第九讲 | “碳中和”时代下:计算的机会在哪里?
碳中和是什么?如何影响我们的生活?与计算又有何关系?8 月 19 日,阿里云【大咖说】全新子系列【计算讲谈社】第九讲《“碳中和”时代下:计算的机会在哪里?》上线,阿里云能耗云负责人周文闻、阿里巴巴研究员吴翰清(道哥)携学员针对该主题展开分享和讨论。
328 0
【计算讲谈社】第九讲 | “碳中和”时代下:计算的机会在哪里?
|
安全 大数据 云栖大会
“为了无法计算的价值” 能成为计算经济时代的支点吗?
“为了无法计算的价值” 能成为计算经济时代的支点吗?
“为了无法计算的价值” 能成为计算经济时代的支点吗?
|
存储 弹性计算 分布式计算
大咖来了|距离“云计算终极目标”,我们还有多远?
CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛对话阿里云弹性计算产品线负责人张献涛,探讨云计算的演进与发展。
大咖来了|距离“云计算终极目标”,我们还有多远?
|
安全 云计算
2021阿里云.计算峰会|想构筑更快,更稳,更安全的云上网络?你不可错过!
本次峰会,我们为大家带来了四大亮点: 首秀:阿里云计算产品家族首次整体亮相 大咖:云上企业先锋分享实战经验 全面:技术、工具、服务、方法论的全面解读 深入:聚焦4大行业,从技术深入到行业解决方案 阿里云联手诸多行业先锋,揭秘云上企业的关键能力,探寻高效,稳定,安全,规范地成为一个云上企业的高速路径
1422 0
2021阿里云.计算峰会|想构筑更快,更稳,更安全的云上网络?你不可错过!