2023年10月31日-11月2日,2023云栖大会在中国杭州·云栖小镇举行,新开普副总裁焦征海在【云服务器 & 计算服务】专场中带来了题为《云原生计算基础设施助力新开普创新提速》的主题演讲,围绕新开普业务上云之路、倚天ECS实例降本实践以及未来业务展望等相关话题展开。
以下是他的演讲内容整理,供阅览。
图:新开普副总裁焦征海
今天和大家分享的是新开普的上云历程。新开普是中国教育信息化领域的首家上市公司,以卓越的ICT服务,构建智慧校园、助力智慧企业、贡献智慧中国为使命,致力于成为世界级的数字产品方案服务商。
一、新开普的上云之路
1、了解新开普
新开普是智慧校园综合解决方案领先企业,主要专注于智慧校园、智慧政企和智慧农水。
在智慧校园领域,新开普服务了全国1300+家高校,高校客户占比达45%;在智慧政企板块,新开普服务了全国10000+家企业,其中有70+家是中国500强企业,是国内唯一的提供“全球一卡通”服务的企业,为20万+职工提供服务;在智慧农水板块,新开普的智慧农业平台获得了中国上市公司协会颁发的“乡村振兴优秀实践案例奖”,获得了河南省的省级标杆荣誉。
- 智慧校园
在智慧校园领域,主要覆盖校园生活、校园管理和教务教学等场景,通过「线下中台 + 一卡通 + 教务 + 学工 + VR实训教学、线上完美校园」的混合云智慧校园解决方案,服务1300余所高校,985高校占比64%,211高校占比41%。
在普教、中职领域,我们推出了省、市级区域性的智慧校园综合解决方案,打造区域性智慧校园管理平台。
(2)智慧企业
智慧政企覆盖的场景主要是从政府机关和企业园区的智能安防、人员管理、智慧后勤以及生产安全和生产信息化等维度作为入口助力企业数字化转型。在新开普服务的10000余家客户中,覆盖了中国500强企业的七大行业的头部企业客户。
(3)智慧农水
在智慧农水板块,分为智慧农业和智慧水务两大场景。
在智慧农业场景中,主要覆盖农业生产的耕、种、管、收各个环节的软件应用系统和硬件终端设备,通过实时的农田环境、农作物涨势、虫禽病情等农田数据的收集,依托大数据、云计算、人工智能技术构建智慧农业的大数据决策和分析平台,实现智能水肥一体的按需灌溉、病虫害的精准防治,为中国农业生产的标准化、规范化和专业化提供技术保障,助力乡村振兴。
在智慧水务板块,主要覆盖从水源源头到居民水龙头的全方位立体感知,依托于物联网技术、大数据技术和人工智能技术实现整个智慧水务从供水环节到用水环节整个资源环节的精准防控、城乡一体化供水,其核心是通过各种技术助力城乡供水。
新开普业务架构如下图所示:
如上图所示,新开普通过产品和技术驱动公司发展,是国家重点扶持的高新技术企业,软件一体化的全系列终端数字产品解决方案和全新的终端产品以及本地化的平台产品和云平台产品全部自主研发,在郑州、北京、上海、深圳等地设立了7大研发中心,在全国的100+ 个城市设立了本地化的服务机构,以贴近客户零距离服务。
2、上云历程
新开普上云过程依赖于阿里云的技术支持,分为以下三个阶段:
第一阶段,2013-2018年,该阶段利用云服务赋能数字化转型。该阶段主要专注于企业的业务上云,通过100+个SaaS服务覆盖1000多所高校,通过阿里云的弹性计算能力支撑200万日活。
第二阶段,2018-2022年,该阶段通过云原生助力用户的极致体验,核心是业务规模的快速发展,使用云原生技术达到了99.99%的无故障时长和秒级的扩容,支撑700万+的日交易数。
第三阶段,2022年至今,该阶段核心是通过AI赋能业务创新,提升资源利用率实现降本增效。
在资源利用率提升过程中,首先要跟实际的场景结合。一个典型的应用场景是从物联网端到互联网端的高并发、低延时的集中短时交易场景。该交易场景的集中时段在中午,要求30分钟之内完成350万笔支付交易,同时要求每笔交易需在两秒之内完成,其跨越了本地的POS终端网络、云平台的网络、三方支付的网络以及手机移动网络。
整个的交易链路环节要在两秒之内完成,所面临挑战非常大。基于延时要求,留给业务系统POS三方支付的时间只有0.5秒。而如何保障0.5秒完成交易呢?可以通过将CPU维持在低水平的方式的应急方案。如何提升资源利率,提升算力资源的效率呢?可以通过倚天ECS实例降本实现。
二、倚天ECS实例降本实践
实践数据证明,在同等算力资源规格下,倚天ECS实例在业务稳定运行的资源利用率阈值接近X86服务器的两倍。
1、降本实践过程
在倚天适配过程中,主要考虑以下四个维度的要素。第一,迁移之后整体的可靠性不受影响;第二个,用户体验不打折;第三,迁移成本和迁移工作量;第四,迁移之后的效果。
通过以上各个要素分析,可以发现整个迁移过程中有几个关键的操作:
首先,通过软件适配性分析JDK和操作系统最佳的运营环境变量;其次,进行功能和性能验证,通过功能验证业务的可用性以及代码改造的工作量,通过等比的压测分析同等规格下降本的效果和业务资源能力提升的效率;最后,性能的调优和共创,这依赖于阿里云和平头哥专家支持。
2、实践经验分享
(1)经验一:使用阿里云Dragonwell JDK+龙蜥操作系统,可有效降低CPU使用率
倚天ECS实例的适配过程中会出现CPU使用率高的情况。对于新开普的应用场景,原先使用CentOS7+OpenJDK8的环境,适配后采用了阿里云Dragonwell JDK+龙蜥操作系统之后,可以有效降低CPU使用率。
(2)经验二:内存使用率虽提升,但性能提升明显
单台ECS的内存使用率会比X86高10%左右,这与降本的目标相悖,基于该情况下,通过测试发现单台ECS的内存使用率增长了10%,但由于其性能提升明显,相当于整体的CPU使用率下降了35%。
(3)经验三:资源利用率提升的阈值与业务特性相关
资源利用率提升的阈值与业务的推进相关。对于高并发、低延时短期集中交易场景,在业务稳定运行、阈值适配之后,资源使用率从30%提升到60%,增长了近50%,CPU核数降低了35%。
1、实践结果
适配的实践数据显示,实例数下降了39%,内存降低了35%,基本达到了通过算力性价比提升资源利用率实现降本增效的目标。
三、未来展望
针对未来AI如何赋能业务加速?
目前,新开普正在做的工作是数字人助手——完美校园小美同学,它上线了10所学校,每所学校每天大约有2000+ 的自动问答,准确率在85%左右。
我们希望能够借助AI大模型赋能,一方面提升科学自动问答的效率、准确率;另一方面,希望通过多轮对话的互动能力赋能,提升问题解答的精准度,降低人工成本。同时,也希望通过大模型的赋能将AI创新场景交互延展到智慧农业和智慧水利场景,借助大模型的能力打造自己的农业小助手、企业BP小助手等一些数字人,助力新开普研究成为世界一流的产品解决方案的目标。