「镁客·请讲」速石科技陈熹:让高性能云计算“如虎添翼”,最优化地配置云资源

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: 速石可以在不同的公有云厂商之间动态地寻找最合适的算力资源。

速石可以在不同的公有云厂商之间动态地寻找最合适的算力资源。

云计算资源就像生活中的水、电、煤气等,是当前互联网乃至新技术浪潮背后最基础、关键的 “底层建筑”。

而云服务是一个巨头割据的市场,亚马逊、微软、谷歌、阿里、腾讯、百度等无一缺席。在这样一个庞大的生态里,也慢慢涌现出越来越多的初创企业。速石科技就是其中一员,他们要做的不是直接和巨头竞争,而是更好地让企业最大化优化配置云计算资源。

速石的开始:高性能云计算

数据存储一直是各行各业,甚至是我们个人日常生活的刚需。对于很多企业级用户来说,随着互联网向着更成熟阶段发展,存储的数据规模越来越多,相应得他们更希望能从既有的数据中挖掘出更多有价值的东西。

当时还在DellEMC的陈熹,主要负责Dell上海地区的超融合产品线的产品研发。有时候,身在局中的人更清楚行业正在经历的瓶颈。

“大家已经不怎么焦虑存储数据了,而云服务的普及也为数据存储提供了一种新的思路。”当数据存储的矛盾得到缓解后,陈熹开始进一步思考:用户真正需要的是什么?他认为答案是和存储密切相关的高性能计算(HPC)。

TB1tM80B4TpK1RjSZFMXXbG_VXa.jpg

何为高性能计算?

像药物的研发、电影特效的制作,很多我们熟悉的场景背后驱动力都是高性能计算。如果云计算是解决存储和网络虚拟化的问题,那么高性能云计算则是让更多的计算机集群资源完成同一项任务。但相比较已经快速商业化的云计算,高性能云计算的发展显然慢了一步。

TB1gCJ4B3HqK1RjSZFEXXcGMXXa.jpg

中国工程院院士李国杰认为,“云计算的易用性会影响传统的HPC计算模式,而按需的云计算给HPC提供了更易交互的计算模式。”

同时,伴随着越来越多的AI场景的出现,传统的高性能计算以及现有平台的技术已经无法满足它们的算力需求。

速石科技成立的初衷就是为企业级用户提供云算力运营服务,帮助他们实现高性能云计算需求,更高效灵活地挖掘现存数据中的价值。他们可以在不同的公有云厂商之间动态地寻找最合适的算力资源,同时与本地私有云协同工作,最优化利用云资源和服务。

在云计算行业,无论是阿里、亚马逊,还是微软、腾讯,这些大厂的资源类型和定价模式都非常复杂,同时每家厂商的优势和特点也有相异之处。如何去让企业最优化地使用多样化的云资源,就是速石在做的事情。

为了解决传统高性能计算中算得慢、算得贵、不灵活等痛点,陈熹表示“我们要从用户的应用入手,然后为应用做标签、标记,并且在运行时动态地去调度这些抽象化的算力资源。”

陈熹认为高性能云计算是一个正在进行时的趋势,速石正在正确的时间点做正确的事情。

速石科技的杀手锏:Serverless 技术

作为先入局者,能分得一杯羹的前提是技术过硬。

据陈熹介绍,目前速石的技术优势最关键在于Serverless 技术,通过其构建的无服务器架构,可以快速提高算力的利用率。

具体包括几个方面:

一是为行业提供并行化和云原生化的转换,Serverless Compiler可将传统应用转换成高并发高性能的云原生应用,从而减少对专业人员的依赖。

二是无服务器的架构Serverless Framework,它可以将用户所有的云的资源,不管是本地还是公有的,变为一个大的资源池。并且能够把功能和资源拆分开,利用下层的异构的多云的计算资源,动态地为用户提供服务。

三是Fastone Virtual Cloud,它可以屏蔽底层不同异构的云平台的差异性,从而使得上层应用获得统一的基础架构环境。同时,速石还会提供一套分布式文件系统,为用户做数据的去重和压缩,提高用户传输数据的效率和性能。

TB1eR0NB6DpK1RjSZFrXXa78VXa.png

那么,速石的高性能云平台到底可以给企业带来什么?

陈熹分享了一个新药研发的案例。通常情况下,如果要做高通量化合物筛选的话,需要在几十万个化合物中找到能够成为药物的先导化合物,而筛选的过程就是做计算,需要大量的算力支持。之前,某新药企业做一次全库的筛选需要将近1200个小时。

速石的方案可以让他们的药物筛选任务在多个CPU以及GPU节点上进行并行计算,将本地难以获取的计算资源动态地迁移到云端,扩大虚拟云的规模。

速石的方案有两个优势:一是提高并行度以及运算效率,二是扩大资源池的规模。“现在他们再做全库筛选的话,大约需要一天不到的时间。”

生物医药企业之外,陈熹表示目前速石关注比较多的场景还有工程模拟,EDA,以及AI。“AI技术的飞速发展和广泛应用带来对高性能算力的需求是前所未有的。异构计算是为了最大限度压榨硅芯片的潜能,而云能提供接近无限的并发资源,对于算力极度饥渴的AI应用,非常需要计算架构上的创新。”

TB12HJ4B7voK1RjSZFwXXciCFXa.png

云服务市场非常大,初创企业可以活得很好

谈及云服务近些年的发展趋势,一个词形容最合适不过:群雄争霸。台上最耀眼的莫过于亚马逊、阿里这样的大厂。相较之下,初创企业有点“星光黯淡”。虽然速石成立的时间不长,但陈熹认为属于创业公司的机会才刚刚开始。

“阿里云在中国,AWS在全球体量其实不算很大,只是占比非常大,但是这个状态不会是最终局面,公有云一定是分割的市场,大家都会有自己的生存空间。因为现在全球几百亿美金的市场,对比企业级IT的市场,其实微不足道。”

如同曾经的服务器市场,多年以前,曾也有人预测大型服务器厂商能干掉所有的竞争对手,成为服务器市场的老大,但事实上,这个市场变得比较分散,各个玩家都在其中占有一定的份额,谁也吃不掉谁。

也许是在存储以及计算行业待的时间比较久,陈熹在此起彼伏的行业热潮和低谷中,更明白一个道理:“创新的产品开发往往要领先于市场需求,如果等到客户明确知道我要什么,再去做的话已经完全来不及。这时候会有更多的巨头、先行的创企去填补市场的空白。”

这也是很多初创公司的机会所在,提前预判市场的需求,及时作出产品研发的调整。当数据时代积累的数据越来越多,高性能云计算必然是一条出路。

速石的目标不仅仅是在高性能计算领域,陈熹想要让速石变成一个更通用的云算力运营平台,这也是他们对于市场的预判。

【镁客·请讲】专注于报道科技创新项目;我们敞开心扉面对每一位创业者,力求为您呈现一群鲜活、有性格的品牌和人物;我们倾听创业故事和人生经历、探讨商业模式和行业趋势、对接资本市场和供需双方,以期为产业发展注入新的活力。

欢迎做客【镁客·请讲】,栏目合作请发送邮件至:post@im2maker.com

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
20天前
|
机器学习/深度学习 人工智能 运维
人工智能在云计算中的运维优化:智能化的新时代
人工智能在云计算中的运维优化:智能化的新时代
117 49
|
2月前
|
监控 Linux 云计算
Linux操作系统在云计算环境中的实践与优化###
【10月更文挑战第16天】 本文探讨了Linux操作系统在云计算环境中的应用实践,重点分析了其在稳定性、安全性和高效性方面的优势。通过具体案例,阐述了Linux如何支持虚拟化技术、实现资源高效分配以及与其他开源技术的无缝集成。文章还提供了针对Linux系统在云计算中的优化建议,包括内核参数调整、文件系统选择和性能监控工具的应用,旨在帮助读者更好地理解和应用Linux于云计算场景。 ###
63 3
|
2月前
|
存储 边缘计算 人工智能
解密云计算:未来科技的基石
【10月更文挑战第6天】解密云计算:未来科技的基石
60 0
|
7月前
|
存储 云计算 开发者
【预告】阿里云计算新品速递:HPC优化实例商业化发布
5月30日14:00,将推出专为云上高性能计算设计的HPC优化实例hpc8ae,旨在解决现有云计算基础设施对HPC应用优化不足的问题,提供经济高效的仿真解决方案,提升计算效率,加速业务创新。直播中,阿里云专家将展示实例在计算流体、有限元分析等领域的应用,并通过两个云上工业仿真Demo进行实践演示。参与直播还有机会赢取丰富礼品。
【预告】阿里云计算新品速递:HPC优化实例商业化发布
|
4月前
|
机器学习/深度学习 监控 API
基于云计算的机器学习模型部署与优化
【8月更文第17天】随着云计算技术的发展,越来越多的数据科学家和工程师开始使用云平台来部署和优化机器学习模型。本文将介绍如何在主要的云计算平台上部署机器学习模型,并讨论模型优化策略,如模型压缩、超参数调优以及分布式训练。
844 2
|
5月前
|
云计算
云计算代码问题之当配置发生变更时,流水线会如何解决
云计算代码问题之当配置发生变更时,流水线会如何解决
37 1
|
6月前
|
存储 缓存 运维
云计算中的服务器选型与配置:技术深度解析
【6月更文挑战第29天】云计算服务器选型与配置深度解析:关注业务需求、技术要求及成本效益。重点包括CPU、内存、存储和网络配置的优化,结合负载均衡、缓存、虚拟化和自动化运维策略,以提升性能和效率,确保云服务的稳定与高效。
|
7月前
|
机器学习/深度学习 网络安全 决策智能
利用深度学习优化图像识别准确性的探索云计算与网络安全的融合:保护云服务的关键策略
【5月更文挑战第30天】 在计算机视觉领域,图像识别的准确性对于后续处理和分析至关重要。本文旨在探讨一种基于深度学习的方法来优化图像识别过程,通过构建一个更加精细和强大的卷积神经网络(CNN)模型,实现对图像特征的深层次挖掘和精确分类。文章首先回顾了当前图像识别中存在的挑战,接着提出一种新型的CNN架构,并通过实验验证了其在多个标准数据集上的性能表现。研究结果表明,该模型在提高识别精度的同时,还能有效降低误识率,为图像识别技术的进步提供了新的视角和解决方案。
|
6月前
|
存储 资源调度 大数据
云计算在大数据分析中的弹性资源调度策略
云计算在大数据分析中的弹性资源调度策略
|
6月前
|
云计算 数据中心 Python
云计算在在线教育平台中的资源管理与优化
云计算在在线教育平台中的资源管理与优化