阿里云庞雄伟:倚天产品能力解析

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 为了更好的方便各位开发者和用户了解并应用ECS倚天实例,由阿里云弹性计算联合基础软件团队 & 平头哥 & 安谋科技(arm)等十余位专家、架构师、开发工程师等,共同发起的【倚天实例迁移课程】正式上线,本次系列课程共计10节,共分为基础篇;架构迁移篇;性能优化篇三个篇章,从不同角度为用户带来更加丰富和专业的讲解。


1360_336.jpg

为了更好的方便各位开发者和用户了解并应用ECS倚天实例,由阿里云弹性计算联合基础软件团队 & 平头哥 & 安谋科技(arm)等十余位专家、架构师、开发工程师等,共同发起的【倚天实例迁移课程】正式上线,本次系列课程共计10节,共分为基础篇;架构迁移篇;性能优化篇三个篇章,从不同角度为用户带来更加丰富和专业的讲解。

2023年8月17日,系列课程第三节《倚天开启云原生算力新时代——倚天产品能力解析》正式上线,由阿里云弹性计算产品专家庞雄伟主讲主讲,内容涵盖:Arm CPU已逐渐成为行业趋势;ECS倚天实例产品能力介绍;ECS倚天实例应用场景落地介绍

本期节目在阿里云官网、阿里云微信视频号、阿里云钉钉视频号、InfoQ官网、阿里云开发者微信视频号、阿里云创新中心直播平台&微信视频号同步播出,同时可以点击【https://developer.aliyun.com/topic/ecs-yitian】进入【倚天实例迁移课程官网】了解更多内容。


倚天开启云原生算力新时代- 倚天产品能力解析 | 课程回放


以下内容根据庞雄伟的分享整理而成,供读者阅览

一、智能时代算力需求爆发及挑战

在过去几十年中,随着计算机技术 & 移动互联网技术的飞速发展,使得数据的产生和存储方面的需求呈现爆发式增长,这些数据包括社交媒体数据、个人信息、传感器数据等。

海量数据分析与处理所依赖的大数据技术,对算力的并发和实时处理能力提出了更高的要求。随着AI技术的不断发展,尤其是当今大模型时代,面临更加复杂的推理和训练场景,对算力的要求非常高。

幻灯片4.JPG

以电商行业为例,电商行业从流量为主转变为精细化运营的过程中,所需要的AI推理智能精准推荐对算力的需求日益增加。以AI为代表的算力规模,每三个月就会翻一倍。海量数据以及AI视频处理对算力要求的提升,导致基础设施需求不断增加投入资源,以满足日益增长的算力资源需求。

在算力需求暴增的同时,摩尔定律演进速度却在逐渐减慢,硬件技术进步的红利见底,CPU性能提升遭遇瓶颈,传统服务器无法满足算力的需求。

幻灯片5.JPG

如今每迭代一代CPU,服务器和数据中心的消耗和成本就会攀升,每千瓦芯片功耗在生命周期内带来上万美金级别的成本,硬件和芯片的成本也在逐步上涨。

云计算面向多租户及高密计算任务时,例如高性能计算、大数据计算、视频转码等,由于CPU线程之间的资源争抢,导致租户之间处理需要相互排队,会直接影响性能,造成性能波动。

二、ECS倚天实例产品能力介绍

从全球服务器出货量来看,X86 CPU在服务器市场中长期占据着主导地位。

全球范围内,以ARM为核心架构的CPU已经开始显现出增长趋势。2019年X86 CPU的出货量超过99%,而ARM CPU占比为0.7%;2022年,ARM CPU出货量增长到7.1%

幻灯片7.JPG

虽然ARM CPU的市场占比比较小,但是增幅很大,从2019年到2022年,短短3年时间,ARM服务器出货量规模增长了近10倍。虽然截止到现在,ARM CPU市场占比仍然是X86的零头,但是这个期间也增加了众多玩家,尤其是自研ARM CPU能够带来效率和算力的提升,同时降低功耗,不少云服务商也开始自研ARM CPU,全球范围大部分的主流IT公司也都推出了基于ARM架构的产品。

以云计算公司为例;阿里巴巴在2021年推出ARM V9架构的倚天CPU产品;在智能网卡领域,Marvell推出了智能网卡;谷歌云和英特尔联合推出了基于ARMDPU产品。

截止到目前,ARM已经支持超过100多个开源项目。下图自下而上可以看到,有网络、操作系统、虚拟化、容器、编程语言以及各种上层负载,ARM都有完善的支持。对于底层网络侧的DBK和OVS等也均可支持。

在语言层面上,Open JDK等可以在ARM平台上直接运行,包括压缩方面的一些主流的计算库,ARM也可以给予强力的支持。


幻灯片8.JPG

上图顶部列出了一些主流的云负载应用,包括常见的数据库、缓存、WEB服务、大数据存储等。左侧可以看到ARM在CI/CD领域也有很大投入,包括GitHub等云原生支持ARM系统,方便开发者在ARM系统上进行开发构建。

在操作系统领域,从主流的发行版OS到社区版OS,现在ARM也都是一等公民。Redis、阿里云的龙蜥社区等,对于ARM系统都有原生支持。

阿里云通过自研的操作系统,集成了主流业务的关键组件,例如编译的供应链、运行库等等,用户无需任何业务改造就可以完成业务迁移。依托ARM开源软件,阿里云操作系统以及阿里云PaaS产品,构建了丰富的ARM实例生态体系。

秉承着一云多芯战略,阿里云在2021年的云栖大会上发布了基于ARM架构的倚天710芯片。

幻灯片9.JPG

阿里云云原生服务器和定制处理器上有着深厚的历史积累和技术沉淀。倚天710芯片是针对云场景的高并发、高性能、高能效需求而设计,其将领先的芯片设计技术与云场景独特需求相结合,最终实现了性能和能效比的突破。倚天710是专门为此打造的一个云原生的处理器芯片。

所谓云原生的硬件含义就在于,这是业界最先进的服务器芯片架构和工艺,面向超大用户基础的云上业务的互相融合,同时通过结合飞天操作系统以及CPU,使得倚天的性价比大幅提升。

倚天710采用最新的ARM V9架构,独立的物理核且无超线程,帮助用户享受极致的算力性能。通过云、CPU、CIPU架构协同,不仅大幅提升网络存储IO性能,并且通过采用创新的多单路硬件设计方案,大幅提升整机CPU密度的同时,也保证了产品的稳定性。当前已经服务于互联网、生命科学、电商等多个行业场景。

阿里云ECS倚天实例支持业界主流的开源软件,在常见的视频编解码、大数据、高性能计算、AI等核心业务场景进行评测,性价比最高可以提升80%

ECS倚天实例已经在阿里云数据中心大规模部署,并且广泛服务内外部客户。在电商核心的交易系统、AI语音推理业务、生命科学、广告、Web服务等的性价比均得到了显著提升。

从芯片层面来看,影响性能的四大因素主要包括ALU计算单元、CPU Cache、主频和加速指令。

幻灯片10.JPG

首先,倚天710处理器无超线程的概念,避免了性能争抢的问题,独享物理核性能也更加强劲,独享Cache应用缓存也更高效。

X86架构是两个vCPU HT共享一个物理核和一个ALU计算单元;而倚天实例采用的是独享物理核的方式,这样可以让算力密集型计算指令不用排队,计算速度更快。

在Cache维度,过去两个vCPU共享一二级缓存相互争抢,性能波动也更加明显,采用倚天CPU独享Cache设计,让vCPU之间互不影响,为重负载计算带来更高性能。

我们以8核32GB规格为例,8核对应的是8个vCPU,对于X86实例,一个vCPU对应一个线程,也就是一个HT;对于倚天实例,一个vCPU对应一个物理核。因此相同规格的倚天实例比X86实例具有更好的算力表现。

不仅如此,ECS倚天实例依托于高密度、低功耗带来的成本优势,定价对比同代系的X86实例便宜至少20%,是目前阿里云最便宜的ECS八代主售实例产品。

众所周知,目前主流的应用,如Web、数据库等生产业务,CPU使用的安全水位基本设计在50%。如果超过了50%,会依托弹性伸缩功能扩容资源,以保证业务的稳定性。

幻灯片11.JPG

背后的原因是,因为X86功耗大,温度上升,从而采用降低频率来规避,进而影响了性能;而ECS倚天实例无任何降频问题,可以将水位提升到70%-80%,从而提升资源的部署密度。这样不仅可以有效减少资源浪费,同时也能达到有效降本的目的。

在算力密集型场景,ECS倚天实例也具备更好的进行度。

幻灯片12.JPG


上图是个典型的视频转码场景。众所周知,在视频转码场景里,对于整个CPU算力的要求非常高,橙色曲线是倚天710芯片,即ECS倚天实例;灰色曲线是X86实例;横轴是转码的路数,纵轴是每个核贡献的FPS性能值。

可以发现,随着转码路数的增加,对于整个倚天710芯片和X86芯片的负载压力也会逐渐变大。随着CPU负载变高,X86实例有一个明显的性能下降的过程,而ECS倚天实例因为采用了低功耗设计,随着业务压力变大,性能有着一个非常线性的输出,没有任何下降的过程。

所以,在这种针对算力要求比较高的密集型场景,ECS倚天实例依托其优异的物理核和无睿频的产品能力,有着更好的性能表现。

ECS倚天实例采用的是阿里云最新的CIPU架构体系,倚天710芯片与CIPU实现了1+1>2的效果,使得芯片将自身的算力优势和CIPU优势相结合,使得ECS倚天实例在用户业务场景取得了更加优异的性能表现。

幻灯片13.JPG

首先介绍下CIPU,CIPU把存储资源、网络资源、CPU 资源,全部通过 CIPU 纳管,就是物理资源加上 CIPU 后就是一个云化的虚拟计算资源池,再依托倚天710芯片独有的CPU算力优势,可以有效提升ECS倚天实例产品端到端的产品性能。

同时,通过CIPU为核心的理念,可以将ECS倚天实例的成本和稳定性得到很好的平衡。也就是说,当前倚天710,1颗CPU的物理核心可以做到128物理核,2个CPU就是256核。如果这2个CPU同时放在一个服务器里,这个服务器的CPU核数密度将达到256。在云上以VM的方式提供服务,256核可以承载2核的VM 128个,4核的VM 64个,也将承载数十个不同租户。

那么当任意一个CPU或是CPU关联内存发生故障,就会影响到服务器上面所有租户的业务。因此,为了降低爆炸半径,通过以CIPU为核心采用双单路的机型设计方式,在保证低爆炸半径的前提下,提高了部署密度,从而有效降低ECS的使用成本。

最新一代的CIPU支持2*100G的网络架构,网络吞吐能力可以提升一倍。不仅如此,也支持eRDMA的能力,也就是说传统服务器上的RDMA这种高速网络传输能力内置到云上,这样可以使得VPC网络的延时降低到8微秒,可以有效提升像Redis这种针对网络时延敏感的业务场景。

新一代的CIPU也支持NVMe ESSD云盘,使得存储IO延时对比之前TCP协议降低10%。由此可见,ECS倚天实例不仅仅是CPU算力的提升,通过新一代CIPU架构体系也可以提升整体存储和网络IO能力,最终使得倚天ECS产品在端到端的业务系统里取得更好的性能表现。

秉持着一云多芯的战略,阿里云发布一天710芯片之后,在整个ECS端到端的产品设计里实现了全栈自研。

因此,在此基础上,阿里云发布了为云而生的CPU以及第一款CPU,也就是从底层基础设施,包含物理机磐久服务器,一个双单路机型,以及神龙虚拟化、自研操作系统,如龙蜥操作系统、自研基础软件,如dragonwell,以及生于云长于云的云产品。

幻灯片14.JPG

所以,ECS倚天实例的真正意义是实现了端到端的协同优化。从软件到硬件,通过这种有效的协同优化,可以显著的提升算力的性价比,同时也能兼顾性能和易用性,可以满足云上用户的多样性计算需求。

不仅如此,通过近几年积累的一些协同优化的经验和能力,可以通过工具化和产品化的输出给到客户。同时,也可以通过产品化的能力让客户没有任何一些适配成本,非常容易的去使用这些产品和应用这些能力,加速自身的业务的创新。

这些能力在阿里巴巴集团内部,包括像电商、支付、大数据等业务层面得到了有效验证,同时也得到外部客户的典型应用场景的落地。

众所周知,从ARM CPU到X86 CPU,从底层的等级层面还是有一些本质的区别。大家目前使用的这些计算软件基本上都是通过高级的编程语言写成的。

而编程语言主要分为两类,一类是编译型语言,一类是解释型语言。编译型语言主要以C++和GO为主;解释型语言主要包含JavaPython等等。

编译型语言通过编译器可以转化为汇编语言,汇编语言进一步通过编译器可以转化为二进制的机器码。


幻灯片15.JPG

这个二进制的机器码可以与ARM架构进行交互,去操控CPU。倚天710是典型的ARM架构产品X86架构上的应用软件,如果重新迁移到ARM架构,如ECS倚天实例上来,是必须通过一定的适配的,包含调优才能达到比较好的运行状态。

这里面主要区分整体应用软件的编译语言来进行相应的区分。如果是编译型语言,必须经过重新编译才能运行,如果是解释型语言,因为解释型语言可以有效屏蔽底层和顶层的架构差异,这样就可以有效屏蔽整机架构的差异,一致性会更好,也就不需要重新编译,仅需要重新部署即可。

像C/C++ 源码需要汇编器编译成机器指令,再通过编辑器编译成函数生成机器码的语言。这些机器语言,必须与CPU的指相匹配,然后在运行时通过加载器加载内存,再由CPU进行执行。

幻灯片16.JPG

由上图可见,因为本身这种C/C++编译语言,在编译之前可能需要一些基础的代码修改工作,但这些工作理论上来说都是比较简单的。修改之后像后面的一些编译、汇编和链接和原有的操作是相同的,不需要其他改变。在针对源码修改的时候,这里简单罗列了四个步骤:

第一步,修改C/C++源码,可直接使用阿里CodeScan对源码进行分析,主要考虑的问题有:

  • 宏相关的替换:解决预编译阶段的差异性问题;
  • 编译器内建函数替换:与指令集架构强相关;
  • 内联汇编替换:针对用户自定义的汇编指令迁移。

第二步,修改构建脚本,此处根据工程使用的编译脚本不同有区别,但是修改内容是固定的:

  • 64位编译选项修改,从X86的-m64修改成ARM平台的-mabi=Ip64;
  • ARM平台的char类型有符号,需要加上-fsigned-char
  • 指定处理器架构换成armv8-a+sve2CPU换成neoverse-n1

第三步,ARM64平台有完善的OS包体系,X86平台使用的库基本可以平替,包的下载途径使用镜像自带,或一般免费/商业包管理平台即可,例如:

  • 阿里开源镜像站
  • Packages for Linux and Unix

第四步,根据应用需求选择编译器,并通过编译器/OS的官方途径下载。

Java为例,解释型语言会通过编译器生成字节码,这个字节码会由JVM虚拟机去执行,因为JVM虚拟机可以将CPU指令机的差异化进行屏蔽,因此这种解释型语言也具备了更好的移植性。

如果用户的业务是以Java、Python这种解释型语言编写,它就不需要像编译型语言那样进行重新编译或代码修改,仅仅通过直接部署即可

幻灯片17.JPG

但这里也存在一个问题,因为现有Java的一些代码可能会通过调用JNI的本地库,这就会带来一些兼容性问题。所以在进行迁移之前,需要把C的本地库进行重新编译,然后再进行业务的迁移和部署。

另外,ARM的生态是最近四五年才蓬勃发展起来的,一些老版本或是Jar包,整体对于ARM的适配度并不好。以JDK为例,新版本会有一个比较好的针对ARM的性能的优化和提升。

针对解释型语言迁移之前,需要把Jar包和ARM版本升级到最新版本,建议是OpenJDK 11或17版本。同时,阿里也有开源的Dragonwell版本,它也可以针对阿里云的倚天进行针对性的优化,拥有更好的性能。

在云时代容器化已经成为一种事实,可以把软件产品打包构建镜像,镜像是最基本也是最关键的一步。因为在云环境中,X86和ARM等不同架构,上文也提及了,从云业务包含整个应用软件的维度,ARM的整个生态包含业务体量,都处于快速的发展期,所以面对X86ARM不同的架构,在整个架构容器镜像时,需要构建出多种不同架构的镜像,以适配不同架构的服务器和业务。

幻灯片18.JPG

所以在拉取镜像的时候会根据当前环境的架构自动拉取对应架构的镜像。例如,X86的环境下,拉取镜像为X86架构的容器镜像,在ARM环境下拉取以ARM架构的这种镜像。

所以在当前的这种CI/CD流程里,以及整个业务的使用和部署阶段,X86ARM并没有像大家想象的那么复杂。而且在目前的开源的原生体系里,我们虽然构建了不同架构的镜像,但是镜像拥有唯一ID,这样在拉取镜像时仅指定镜像架构,就可以对应拉取对应架构版本。

所以在架构混部的CI/CD流程里,倚天实例也是简单易用的。

在阿里云ECS倚天实例发布之前,阿里云已经有了多年的迁移经验。在阿里巴巴集团内部,包括电商、数据库、大数据和存储等,都有很多年的一个整体X86到ARM的架构迁移经验,也通过这些经验有了一些有效的沉淀,并通过工具化和产品化的能力,赋予到以前的实例,以及以前实例给客户整体业务的迁移过程中。这里主要包括,CodeScan等迁移工具。CodeScan这种迁移工具可以适配当前主流的编程语言,包括像JavaPython、Go等等。

幻灯片19.JPG

客户的软件包上传到CodeScan迁移工具上之后,我们会给出针对迁移、适配和修改建议,会出一个报告列表,提供针对自动化输出的修改建议,可以提效整个业务迁移流程。

另外,在业务迁移之后,还会提供调优工具,这个工具可以有效的将我们沉淀下来的优化经验,通过工具化的一键配置的能力,快速将客户的ARM架构上的业务发挥出最优性能。

如果,当前客户的业务比较复杂,而整体当前的迁移经验比较少,也可以针对性的去提供性能飞虎队的专家去现场讲解,以提升整体业务线的效率,包含给业务人员做培训等等。

当前,阿里云主流的PaaS产品都已经支持了ECS倚天实例。具体的产品如下图所示,包括EHPC、RDS、EMR、钉钉等。

幻灯片20.JPG

这些产品在整个ECS倚天实例的适配过程当中,已经屏蔽了整体的ARM的差异化,所以最终用户在使用这些产品的时候,无需做任何架构层面的适配和优迁移。这样就可以在零代码改造的前提下,享受倚天实例带来的性价比收益。

举个例子,RDS数据库,在使用了ECS倚天实例之后,结合近半年的性能优化经验和沉淀,它的整体性能对标同代系X86的实例,提升了10%,同时价格更便宜。

所以图上的这些Paa产品,在完成了ARM架构的适配工作之后,用户无需再进行任何业务改造就可以直接使用,享受ECS倚天实例带来的性价比红利。

三、ECS倚天实例场景落地介绍

1、阿里集团内部应用倚天实例

ECS倚天实例已经应用到阿里集团内部的电商、存储、数据库、大数据等核心场景。今年我们已经将电商这种核心的业务部署到倚天实例里,然后通过统一的资源池调度,以应对峰值流量。

幻灯片22.JPG

ECS倚天实例在集团尤其是淘宝电商业务中,使用前后它的整个核心业务的性能有怎样的变化呢?如上图所示,对标之前的X86实例,ECS倚天实例的性能可以提升15%。大数据场景承载了像淘宝、菜鸟等业务的数据分析,使用ECS倚天实例后,它的整体性能收益提高了20%。存储和数据库也都有相应明显的不同程度的性价比提升。

所以,ECS倚天实例在整个阿里巴巴集团内部的业务应用上,性价比的表现优异,因此可以大规模的释放技术红利,终端的消费者和商家也能享受比较丝滑的购物体验。

2、倚天实例助力在线教育客户降本增效

如下图所示,这个在线教育客户的使用场景是视频的转录和视频后处理,对音视频流进行编辑、转码处理,需要消耗大量的CPU资源。

幻灯片23.JPG

随着直播业务量的上升,视频处理环节的IT成本也会同步增加。因此,如何找到一个高性价比的替代方案,实现降本增效成了客户的痛点。

客户使用倚天实例后,结合最新的ARM架构,在整个视频编解码的计算场景里,有了一个比较显著的性价比提升,视频转录模块性能提升28%,性价比提升50%。同时倚天实例原生支持ECS的弹性伸缩能力,可以有效满足客户波峰波谷的业务诉求。

3、ECS倚天实例AI场景实践

下图是一款开源的密度泛函理论软件应用ECS倚天实例的AI场景实践。这款软件已经应用于材料、药物和新能源等领域。像这种科学计算软件,是需要大量的资源的,而传统的资源有限而且成本比较高。

以下图为例,倚天实例和7代的X86以及6代的高主频实例的计算时间是基本一致。但是需要注意的是,上面测试的倚天710使用的是4X规格,仅为x86实例规格的一半,这个结果主要是得益于倚天710独立的物理核心,独立的Cache和独立的ALU计算单元,同时没有超线程的性能损耗。

幻灯片24.JPG

不仅如此,客户的研究人员在阿里云上进行了贴进实际算力的验证,EHPC是可以实现计算资源集群的弹性伸缩,保证计算在云上和本地操作类似的操作实验。客户使用倚天的核心运算量是一定的,而且最终计算资源的消耗随着核心数量的增加而线性增加。所以说,倚天实例不仅仅具备一个比较好的性价比提升,同时它的线性度在最终客户的业务场景中也得到了很好的体现。

因此,最终在相同业务的压力下,这个客户的成本节省了近70%

4、ECS倚天实例在游戏场景的实践

下面这个案例客户是国内顶级的移动网络游戏开发商和运营商,拥有多年的移动互联网开发经验。团队历时三年开发并发布的一款某塔防类实时对战游戏,伴随着这款游戏的火爆,玩家数量迅速上升,像数据处理、数据计算、网络传输以及其他资源消耗也同步增加。具备高性价比、高算力能力是客户急需解决的问题。

幻灯片25.JPG

客户使用ECS倚天实例后,在它的大厅服务、聊天服务、校验服务等对比X86实例,承载的游戏人数可以提高120%,综合性价比提升近200%。而且游戏服务本身是基于Java语言编写的,也不会产生任何迁移成本。

5、ECS倚天实例大数据场景实践

大数据也是一个比较典型的算力密集型场景。下面这个客户是线下大数据资源需要进行降本增效,它进行ECS倚天实例整体测试和灰度后发现,整体性能对标X86实例可以提升30%,。

其实,在整个大数据场景我们也支持了PaaS产品EMR,用户可以直接选用EMR+ECS倚天实例产品组合,以享受高性价比带来的红利。

幻灯片26.JPG

本身大数据场景是基于Java语言进行构建的,它的整个业务迁移和设备成本也比较低,仅仅是升级特定的Jar包就可以完成业务的迁移和适配。

幻灯片27.JPG

倚天社区作为一站式的开发者的支撑平台,提供了丰富的业务使用经验,包含软件应用、工具、活动信息等等,欢迎大家登录去社区了解更多咨询,以上就是我本次课程的全部内容。

想要关注更多【倚天实例迁移课程】直播的同学可以点击链接/扫描下方二维码进入活动官网了解更多资讯!

广告机海报9-16.jpg

相关文章
|
3天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3天前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之使用pyodps读取OSS(阿里云对象存储)中的文件的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
2天前
|
数据采集 分布式计算 DataWorks
DataWorks产品使用合集之在阿里云的DataWorks中,使用CREATE AS创建分区表的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
17 2
|
2天前
|
分布式计算 DataWorks 调度
DataWorks产品使用合集之阿里云的DataWorks中,提交手动业务流程的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
14 0
|
3天前
|
分布式计算 DataWorks Java
DataWorks产品使用合集之阿里云DataWorks专有云环境下,上传MaxCompute的UDF(用户自定义函数)的JAR包的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
11 0
|
3天前
|
缓存 分布式计算 DataWorks
DataWorks产品使用合集之阿里云DataWorks中,天任务依赖小时任务的调度运行如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
11 1
|
3天前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之在DataWorks中,使用JSON解析函数将MySQL表中的字段解析成多个字段将这些字段写入到ODPS(MaxCompute)中如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
11 3
|
3天前
|
分布式计算 Java 大数据
MaxCompute产品使用合集之大数据计算MaxCompute外部表映射了oss中的csv文件,看到"\N"被解析为"N",是什么原因
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3天前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之阿里云MaxCompute对SQL语句的长度的长度限制是多少
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3天前
|
SQL 数据管理 API
数据管理DMS产品使用合集之阿里云DMS提供API接口来进行数据导出功能吗
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。

推荐镜像

更多