工作负载就绪 | 买服务器可不是因为它酷酷的

简介:

云计算、大数据为代表的技术不断发展,

企业的业务需求更处在动态变化之中,

打造未来就绪的企业,

需首先“让服务器面向工作负载就绪”,

方得以不变应万变。

没有人是因为服务器长得很酷才去买他们的,人们购买服务器只有一个原因——用它们来运行工作负载,帮助企业解决计算需求和处理数据,完成交易或是分析得出有利于企业经营的价值,保证企业IT的业务工作负载得以有效、顺畅的执行。


但就像我们都知道处理器有两个不尽相同的性能衡量指标——浮点计算能力和整数计算能力一样,服务器的执行效率因为其配置和架构不同,有着不同的适应性的工作负载,在企业完整的IT业务堆栈中,一旦很小部分的服务器处于低效率的运行状态,就可能造成整个企业业务的停顿;成本昂贵的IT部署和基础设施难以应对工作负载的需求,更无法实现最佳的性能和最简单的管理。

让服务器面向工作负载就绪

“让服务器面向工作负载就绪”,这句话听起来酷酷的,但不难理解,这是要让不同类型、不同配置、不同特质的服务器,去执行它们最适合的工作负载,比如说,单节点性能较低的高密度服务器,更加适合互联网门户接入;处理器性能更好的四路或八路服务器,是虚拟化的上佳平台;灵活多变的双路服务器,可以通过不同的配置,满足类似高性能存储服务器的需求。

不过,面向工作负载的服务器并不仅仅是配置上的变化和不同,企业用户需要做的是在了解自身的企业业务负载的情况下,利用OEM合作伙伴所提供的、以服务器及其定制化、个性化为核心的计算平台解决方案,来保证业务负载得到顺利的执行。

这其中,要考虑的因素很多,比如说要在性能和经济性之间取得平衡;比如说要引进某些服务器相关组件;再比如说,在服务器的原厂管理平台或是BIOS中,是否同样大有文章可做。

这就像是在一场京剧之中,有青衣、老生、花旦,也有小生、花脸、武生等不同的行当,每个行业都有其对应的经典角色,比如说,《六月雪》中的窦娥,是青衣的经典;《铡美案》中的包拯,必须是铜锤花脸的角色;一旦让青衣唱了包拯,让花脸唱了窦娥,就都不是那么回事儿了。

不过,不同于似已成为历史的京剧,数据中心的工作负载是在演进和发展的。几年前,数据中心内的工作负载可能主要还是OLTP,高端服务器、核心数据中心资源都是为了交易型应用服务的。

但现在,OLAP与OLTP的地位已然持平,实时数据分析、大数据分析、非结构化数据处理、混合云工作负载等等新的工作负载出现,意味着服务器面向工作负载优化的工作是需要动态变化的。

让数据更靠近计算 越来越多的工作负载与大数据有关

随着云计算和大数据的发展,我们看到了一个明显的趋势,那就是“数据”已经无处不在,并且在数据中心工作负载中的地位不断提高,越来越多的新业务负载,比如说实时数据分析、Hadoop、Spark、SAP HANA,都是以数据为核心的。

另一方面,随着服务器与存储融合的趋势越来越明显,服务器的数据存储能力同样被寄予厚望,越来越多的企业用户认为,“既然可以在服务器中进行数据存储和I/O需求”,为何要去购买昂贵的企业级存储系统,让数据在服务器内同样也使得数据更贴近计算、更贴近处理器,这不是一件很好的事情么?

“通过让存储更靠近计算并充分利用业界领先的存储可扩展性和大型内存容量而灵活地扩展负载”,在这样的指导思想之下,越来越多的戴尔PowerEdge服务器开始在存储上下功夫,PowerEdge 13G中的面向高端关键业务市场的R930的设计思路即是如此。

就硬件配置上来说,R930包含96个DIMM的6TB内存、24个内置硬盘,并支持最多8个高性能PowerEdge Express Flash NVMe PCIe SSD。值得注意的是,戴尔作为在服务器领域首家出货NVMe PCIe SSD的厂商,在R930服务器中已经可以支持到3.2TB的PCIe SSD,而且这些SSD是以前置安装、支持热插拔的2.5寸盘的形式出现的,更容易替换和更新,而性能则是同样出众。

R930的设计是符合当前关键业务服务器市场需求的,随着大数据(实时)分析成为企业新的关键业务应用,四路服务器被越来越多地应用到这一领域中来,这意味着服务器不仅需要容量较大的内存,而且需要更大容量的闪存容量以支持高性能的OLAP或是内存计算的分层存储——别忘了,R930还可以支持最多24个2.5英寸SSD或HDD。

与R930类似,戴尔还有一款PowerEdge R530xd,这同样是针对大数据及数据存储需求而优化的产品,但与R930不同,R530xd的是“专为中国互联网市场,适合Web技术需求而打造的存储优化型服务器”,适合大数据、分布式数据存储以及内容分发网络(CDN)应用。

R530xd在2U机架空间内,提供了14个内置硬盘、16个DDR4 DIMM的配置可能性,具有5 个PCI Express (PCIe) 3.0 插槽,与前代PCIe 2.0 相比,数据吞吐量可提升2 倍——总的来说,R530xd是为了要求更高经济性、更大存储容量的互联网服务商所提供的,它的经济性更佳,同时又有十分强大的数据存储能力。

PowerEdge FX2在存储方面的优化则更进一步,与R930和R530xd的存储优化更多还是停留在硬件配置层面不同,PowerEdge FX2则将硬件架构、软件管理以及整体方案有机结合在了一起。

比如说,在针对Oracle数据库的数据存储及加速上,当我们在PowerEdge FX2机箱中的每一个FC630节点上配置Express Flash PCIe SSD,并利用Fluid Cache for SAN缓存软件将服务器端闪存与后端戴尔SC阵列融为一体时,Oracle RAC集群的事物处理量便可增加3.7倍。

PowerEdge FX2中的本地PCIe SSD缓存通过整合SanDisk DAS Cache软件,FC830服务器上的Express Flash PCIe SSD能够加速FD332中的SAS RAID。对比在PowerEdge R820上由PERC RAID卡CacheCade技术配置的SSD缓存加速RAID方案,PowerEdge FX2实现了每分钟处理订单数、支持虚拟机数和可用驱动器数的大幅提高。

随着对数据、对实时性、对数据分析的要求越来越高,数据中心内计算和存储之间的距离正在缩短,路经就是将CPU与存储I/O之间的距离缩短,其中自然会利用到闪存技术,但必须要铭记的是,如果只是硬件上的变化,没有软件上的管理和调度,仍然无法得到最好的效果,戴尔的Fluid Data 理念及其Fluid Cache for SAN即是如此。

数据中心的重构 软硬多层结合实现工作负载就绪

数据中心的硬件重构势头已经不可阻挡,分析公司IDC所定义的融合基础架构/共享式基础架构现在是数据中心的重要选择之一,在这样的架构中,硬件节点(往往不只是计算节点)的扩展就像是“砌墙”,能够很好地实现类似Google那样的数据中心节点横向扩展的需求。

同样以PowerEdge FX2举例,在一些静态网页支持和软件新产品开发测试层面,服务器对单节点性能要求不高,但是对密度和节点数的要求很高。因此客户更在意节点密度、能耗,而对性能要求不是特别高。这时戴尔的FX2加上微服务器节点FM120x4就会大显身手. FM120X4是第一款戴尔基于Intel ATOM CPU的服务器。

比如说,可以就此设计这样一个架构:每个FM120计算模块中包含2个Intel ATOM SoC独立节点,这样PowerEdge FX2机箱8个FM120就是16个微服务器。如此一来,每个机架的服务器密度可以是传统1U机架式服务器方案的8倍,由于采用服务器IO共享架构,减少了每台服务器的线缆数达40%,而且由于采用Intel Atom CPU,本身设计就是提供了可观的高密度,同时降低整体功耗,所以能大幅降低运营成本。

PowerEdge FX2之外,戴尔也意识到需要有新的、面向超大规模数据中心客户的工作负载就绪产品线及解决方案,才能够保证原有PowerEdge C服务器在逐步转型之后,戴尔仍然能够在横向扩展、大规模数据中心领域保持稳定的市场份额。

戴尔数据中心可扩展解决方案(DSS)正是其中的选择之一,这一系列旨在满足Web技术、电信服务提供商、托管公司、石油天然气和科研机构的具体需求,采用经过优化的简约硬件设计思路、经过调整的实现模型、开放且符合业界标准的系统管理机制外加速度更快的产品上手引导。

与传统的PowerEdge系列服务器不同,DSS专注于实现操作系统支持、经过精简的生命周期与事务支持能力,且无iDRAC许可升级选项。相关支持服务主要面向以技术为核心、且需要对自身服务进行规模化优化的客户。

DSS 1500、1510、2500等产品都是面向大规模横向扩展的数据中心企业客户的,其1U 2S、1U 1S、2U 2S的架构设计是符合当前云计算服务商的采购需求的,另一方面,作为业界最高密度的存储服务器的DSS 7000,能够满足未来百万兆级的存储需求。

但毋庸置疑的是,DSS 7000的目标是超大规模数据中心客户以及云计算服务提供商,是一个云计算构建“模块”:“在其超大规模领导力的基础之上,这款新的存储服务器是基于DCS XA90并能够在一个4U机箱中提供最高720TB的存储容量。DSS 7000配备最多90个热服务3.5英寸驱动器和两个2-插槽服务器节点,以较低的每GB成本为对象和块存储提供云构建模块。

当然,服务器面向工作负载就绪和优化的路径并非只有前述所说的内容,这其中至少还包括了下面的戴尔技术蓝图:

适用于Oracle 12c数据库的戴尔集成式系统

结合Oracle企业管理器、Oracle VM和Oracle Linux,融合戴尔OpenManage、戴尔服务器、存储和网络,支持SQL Server、Oracle 12c、MySQL及MongoDB等数据库,专门针对数据库结构化数据工作负载优化,借助Fusion-io的闪存技术,19U的这一系统,“与其他的配置相比,查询时间极短,同时可提供100万次的IOPs,并能够把延迟降低96%”;

在高性能计算领域,从未来就绪的角度出发,全面引入InfiniBand

带宽提高69%,可以提供更高的吞吐量,以及把延迟时间降低41%,同时,通过自动化的HPC管理获得2倍于以往的性能。

针对微软统一通信和协作方案进行优化

与手动的方式相比可以把Sharepoint的迁移时间减少70%;与通常需要2天的时间相比,只需5分钟就能为UC&C系统部署一个新的服务器;此外,与托管的Microsoft Exchange相比,内部部署的方式可以降低24%的总体拥有成本。

就面向工作负载的就绪和优化来说,戴尔不仅仅提供了针对不同工作负载的产品,如PowerEdge R930、530xd、FX2及DSS服务器,更结合OpenManage等软件,结合软件、硬件、经典配置、自动化设置和优化调优,针对Oracle、微软、SAP预计通用HPC应用进行了以工作负载适配、调优、就绪为核心的整体工作。

戴尔所做的这些,就是从硬件重构,方案整合,软件定义,三个角度面向工作负载就绪的整体解决方案,从底层到上层都已经为未来的工作负载就绪。


本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
存储 弹性计算 缓存
ecs负载评估
ECS负载评估基于资源综合性能得分,衡量CPU、内存、磁盘I/O、网络和系统负载等指标。得分0-5为低负载,5-80正常,80-100高负载。高负载可能需优化或扩容。根据负载级别,可调整资源配置、优化性能或使用自动伸缩服务,确保服务稳定和高效。
51 2
|
2月前
|
存储 弹性计算 编解码
ecs实例规格工作负载模式
阿里云ECS实例有多种工作负载模式:计算密集型(适合高性能计算)、内存密集型(适用于内存数据库)、通用型(平衡资源,多场景适用)、大数据型(优化大数据分析)、共享型(低成本,轻负载)和企业级实例(高稳定性和隔离性)。用户依据业务需求选择实例规格,结合SLB和ESS服务可优化架构,应对动态负载。
23 4
|
10天前
|
监控 测试技术
【亮剑】理解CPU负载对服务器稳定性的重要性,并提供了诊断和解决CPU负载过高问题的步骤
【4月更文挑战第30天】本文阐述了理解CPU负载对服务器稳定性的重要性,并提供了诊断和解决CPU负载过高问题的步骤:1) 使用监控工具分析CPU使用率和系统负载;2) 深入排查运行队列、进程占用、系统调用和硬件状态;3) 根据排查结果进行代码优化、调整进程优先级或限制CPU使用率,必要时升级硬件。建议建立监控体系,定期性能测试,并持续优化以保证服务器高效运行。
|
2月前
|
存储 弹性计算 前端开发
ECS负载问题之前端包加载很慢如何解决
ECS(Elastic Compute Service,弹性计算服务)是云计算服务提供商提供的一种基础云服务,允许用户在云端获取和配置虚拟服务器。以下是ECS服务使用中的一些常见问题及其解答的合集:
|
3月前
|
弹性计算 监控 Linux
ECS实例问题之负载异常如何解决
ECS实例指的是在阿里云ECS服务中创建的虚拟计算环境,用户可在此环境中运行应用程序和服务;本合集将介绍ECS实例的创建、管理、监控和维护流程,及常见问题处理方法,助力用户保障实例的稳定运行。
|
8月前
|
存储 缓存 监控
Java 经典面试解析:服务器卡顿、CPU飙升、接口负载剧增
解决这个问题的关键是要找到Java代码的位置。下面分享一下排查思路,以CentOS为例,总结为4步。 第1步,使用top命令找到占用CPU高的进程。 第2步,使用ps –mp命令找到进程下占用CPU高的线程ID。 第3步,使用printf命令将线程ID转换成十六进制数。 第4步,使用jstack命令输出线程运行状态的日志信息。
212 0
|
11月前
|
缓存 运维 监控
如何通过一系列步骤来诊断和解决服务器CPU负载过高问题?
如何通过一系列步骤来诊断和解决服务器CPU负载过高问题?
570 0
WGCLOUD学习使用 - 服务器负载值过高会告警吗
会 如果主机的负载值超过告警阈值,就会发送告警通知
|
安全 Java 关系型数据库
案例之创建资源服务器准备工作|学习笔记
快速学习案例之创建资源服务器准备工作
92 0
案例之创建资源服务器准备工作|学习笔记
|
安全 NoSQL jenkins
Linux->服务器被挖矿&CPU或内存高负载处理
Linux->服务器被挖矿&CPU或内存高负载处理
240 0