倚天产品介绍|倚天ECS加速国密算法性能

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
简介: 倚天ECS是阿里云基于平头哥自研数据中心芯片倚天710推出arm架构实例,采用armv9架构,支持SM3/SM4指令,可以加速国密算法性能。本文基于OpenSSL 3.2和Tongsuo 实测对比了倚天ECS g8y实例和Intel g7 实例国密性能。为用户选择ECS提供参考。

引言

国密算法,是由国家密码管理局认定和公布的密码算法标准及其应用规范,包括SM1、SM2、SM3、SM4、SM7、SM9和祖冲之密码算法(ZUC)等。国密算法与国际通用算法对应关系如下所示:

算法分类

国际通用算法

国密算法

对称算法

AES、DES、3DES、RC4等等

SM1、SM4、SM7、ZUC

非对称算法

RSA、DSA、DH、ECDSA、ECDH等等

SM2SM9

杂凑算法

SHA1、SHA2、MD5等等

SM3

认证加密

AES-GCM、AES-CCM等等

SM4-GCM、SM4-CCM

其中,SM2、SM3、SM4、SM4-GCM算法应用较为广泛,如政务信息、经济信息、企事业内部敏感信息的加密、网络安全认证、网上银行、数字签名等方面。这几种常用国密算法已经公开并已商用,且在开源OpenSSL中得到实现,目前实现国密算法的开源软件还有GmSSL、Tongsuo等。除了软件层实现国密算法外,还有许多硬件厂商在PCIe标卡或SOC内集成了国密算法,通过硬件卸载方式提升国密算法的安全和性能。

倚天ECS国密性能

倚天ECS是阿里云基于平头哥自研数据中心芯片倚天710推出arm架构实例,采用armv9架构,支持SM3/SM4指令,可以加速国密算法性能。铜锁(Tongsuo)是阿里巴巴对外开源的基础密码库,为存储、网络、密钥管理、隐私计算等诸多业务场景提供底层的密码学基础能力本文将基于OpenSSL 3.2和Tongsuo 实测对比了倚天ECS g8y实例和Intel g7 实例国密性能。

被测ECS实例类型配置如下:

Processor

ECS type

倚天710

g8y.8xlarge

x86处理器

g7.8xlarge

操作系统和gcc版本如下:

GCC version

10.2.1 20200825 (Alibaba 10.2.1-3 2.32)

Operating System

Alibaba Cloud Linux 3.2104 LTS

硬件信息可以通过lscpu查看

[root@Yitian]# lscpu
Architecture:        aarch64
Byte Order:          Little Endian
CPU(s):              32
On-line CPU(s) list: 0-31
Thread(s) per core:  1
Core(s) per cluster: 8
Socket(s):           1
Cluster(s):          1
NUMA node(s):        1
Vendor ID:           ARM
BIOS Vendor ID:      Alibaba Cloud
Model:               0
BIOS Model name:     virt-rhel7.6.0
Stepping:            r0p0
BogoMIPS:            100.00
NUMA node0 CPU(s):   0-31
Flags:               fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma lrcpc dcpop sha3 sm3 sm4 asimddp sha512 sve asimdfhm dit uscat ilrcpc flagm ssbs sb dcpodp sve2 sveaes svepmull svebitperm svesha3 svesm4 flagm2 frint svei8mm svebf16 i8mm bf16 dgh
[root@Yitian]#

SM2非对称算法性能

SM2算法基于椭圆曲线(ECC)算法,包含数字签名,公钥加解密,密钥交换。相对于RSA算法,SM2密码强度比2048位的RSA密码强度要高,速度更快。SM2算法在嵌入式领域签名验签应用较多。

SM2性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed sm2

加密库

SM2

sign/s

verify/s

Tongsuo

g7

10910.5

12750.2

g8y

27213.1

28727.2

openssl-3.2

g7

10920.4

12830.1

g8y

27425.8

28528.5

image.png

测试结果:SM2算法性能,Tongsuo和openssl3.2测试结果表现一致;签名性能倚天ECS g8y实例是g7的2.49倍;验签性能倚天ECS g8y是g7的2.22倍。

SM3摘要算法性能

SM3算法常用于数字签名和数据完整性保护。算法可以对一定长度的消息,填充和迭代压缩后,生成长度为256比特的散列值,又称“数字指纹”。SM3算法和MD5算法的计算迭代过程类似,采用Merkle-Damgard转换,整个转换执行过程可以概括成四个步骤:消息填充、消息扩展、迭代压缩、输出结果。SM3算法可以应用在数据存储中指纹的生成,数字影音完整性校验等等。

SM3性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm3

加密库

SM3

1K bytes

8K bytes

Tongsuo

g7

889359.02

988383.91

g8y

3851532.97

4265263.10

openssl-3.2

g7

888715.26

983979.35

g8y

3844803.34

4264506.71

image.png

测试结果:SM3算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的计算摘要,倚天ECS g8y实例是g7的4.3倍。

SM4对称算法性能

SM4对称算法用于实现数据的加密/解密运算,以保证数据和信息的机密性。SM4算法与AES算法具有相同的密钥长度、分组长度。SM4算法由加解密算法和密钥扩展算法组成,采用非线性结构,分组长度为128b,密钥长度为128b。SM4主要在网络数据、流媒体的加密保护,以及存储数据或文件的加密保护应用较多。

SM4-CBC性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-cbc

加密库

SM4-CBC

1K bytes

8K bytes

Tongsuo

g7

857721.17

858860.20

g8y

8445351.80

8450402.99

openssl-3.2

g7

857374.04

858852.01

g8y

8437472.60

8452295.34

image.png

测试结果:SM4-CBC算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的加解密,倚天ECS g8y实例是g7的9.84倍。

SM4-CTR性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-ctr

加密库

SM4-CTR

1K bytes

8K bytes

Tongsuo

g7

825366.53

826619.22

g8y

30621407.23

31672524.80

openssl-3.2

g7

825741.99

827034.28

g8y

30596200.79

31688701.27

image.png

测试结果:SM4-CTR算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的加解密,倚天ECS g8y实例是g7的38.3倍。

SM4-XTS性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-xts

加密库

SM4-XTS

1K bytes

8K bytes

Tongsuo

(未支持sm4-xts)

g7

NA

NA

g8y

NA

NA

openssl-3.2

g7

830255.10

837741.23

g8y

7598128.13

7347869.01

image.png

测试结果:SM4-XTS算法性能,8K数据的加解密,倚天ECS g8y实例是g7的8.77倍。

SM4-GCM 认证加密算法性能

GCM(Galois/Counter Mode)是认证加密(AEAD)模式中的一种, 能同时确保数据的保密性、完整性,它还可以提供附加消息的完整性校验。SM4-GCM算法适用场景TLS连接场景,如支持国密算法的浏览器。

SM4-GCM性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-gcm

加密库

SM4-CTR

1K bytes

8K bytes

Tongsuo

g7

894681.43

899358.72

g8y

18692320.94

19156877.31

openssl-3.2

g7

894615.89

899618.13

g8y

18686604.63

19151476.05

image.png

测试结果:SM4-GCM算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的加解密,倚天ECS g8y实例是g7的21.2倍。

总结

本文基于OpenSSL 3.2和Tongsuo 测试对比了倚天ECS g8y实例和Intel g7实例几个常用的国密算法性能。可以看到g8y实例性能全面领先于g7,这要得益倚天g8y强大的多核物理核心,先进的armv9架构。另外我们也看到阿里巴巴开源的Tongsuo加密库和OpenSSL 3.2的性能表现结果一致,对于那些依赖OpenSSL1.1加密的应用来说,Tongsuo不失为一个优秀高性能加密库替代产品。此外,倚天g8y实例售价比g7实例低23%,是极具性价比的一款云计算实例产品。

好啦!小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽,请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8

【扫码填写上方调研问卷】

欢迎每位来到弹性计算的开发者们来反馈问题哦~

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
22天前
|
存储 NoSQL 固态存储
阿里云服务器ESSD云盘解析:性能、计费与适用场景介绍
阿里云服务器ESSD(Enterprise SSD)云盘深度融合了25 GE(千兆以太网)网络与RDMA(Remote Direct Memory Access,远程直接内存访问)技术。凭借这一先进的技术组合,它能够为单个云盘赋予高达100万的随机读写性能,同时实现单路情况下的低时延特性。本文将围绕阿里云服务器ESSD云盘展开全面且深入的介绍,涵盖其规格参数、计费模式、适用应用场景、对NVMe协议的支持情况、容量范围与性能级别之间的关联,以及不同实例规格下的存储I/O性能表现等多个方面,旨在助力读者全方位、深入地了解这一卓越的云盘产品。
|
1月前
|
缓存 弹性计算 数据挖掘
阿里云服务器经济型e与通用算力型u1实例怎么选?二则性能及适用场景区别参考
在当今数字化时代,云服务器已成为众多个人开发者、学生、小微企业以及中小企业开展业务、搭建网站、运行应用程序等不可或缺的基础设施。阿里云推出了多种类型的云服务器实例,以满足不同用户的需求。其中,经济型e实例和通用算力型u1实例备受关注。经济型e实例ECS云服务器2核2G3M带宽新购和续费同价99元1年,通用算力型u1实例2核4G5M带宽新购和续费同价199元1年(限企业用户)、4核8G云服务器955元1年。本文将为大家介绍阿里云服务器中的经济型e实例和通用算力型u1实例的特点、区别以及新手选择参考。
|
1月前
|
存储 缓存 安全
阿里云九代云服务器c9i/g9i/r9i实例性能、适用场景解析及活动价格参考
阿里云九代云服务器c9i、g9i、r9i实例是其最新推出的高性能企业级云服务器,凭借其卓越的性能和丰富的功能,广泛应用于机器学习推理、数据分析、高网络包收发等众多场景。接下来,我们将深入探讨这三款实例的性能、适用场景以及价格等方面的详细信息。
147 15
|
1月前
|
存储 机器学习/深度学习 安全
阿里云服务器通用型实例解析:g7/g8a/g8y/g8i性能对比与场景化选型参考
在阿里云服务器的通用型实例规格中,通用型g7、通用型g8a、通用型g8y和通用型g8i,凭借其强大的性能和灵活的配置,成为了众多企业和开发者的首选。这几个实例规格相比经济型e和通用算力型u1等实例规格,性能更为强劲,尽管它们的处理器与内存配比通常为1:4,但在处理器架构、存储能力、网络性能及安全特性等方面各有千秋,因此适用场景也各有侧重。以下是对通用型g7、g8a、g8y、g8i实例的详细性能对比、适用场景分析及选择建议。
|
1月前
|
弹性计算 数据挖掘 测试技术
阿里云服务器2核8G、4核16G、8核32G配置热门实例性能、适用场景对于与选择参考
2025年,阿里云针对2核8G、4核16G、8核32G这三种主流配置,推出了一系列极具吸引力的活动,为用户提供了多样化的选择。目前,2核8G配置的云服务器活动价格为522.79元/年起,4核16G配置的云服务器活动价格为2149.92元/年起,而8核32G配置的云服务器活动价格则为4249.44元/年起。这些价格涵盖了经济型e、通用算力型u1、通用型g8i、通用型g7和通用型g8y等不同实例规格,为用户提供了多样化的选择。本文将对这些配置热门实例规格的实例性能、适用场景和活动价格做个对比,以供选择和参考。
|
1月前
|
存储 缓存 数据挖掘
阿里云服务器实例选购指南:经济型、通用算力型、计算型、通用型、内存型性能与适用场景解析
当我们在通过阿里云的活动页面挑选云服务器时,相同配置的云服务器通常会有多种不同的实例供我们选择,并且它们之间的价格差异较为明显。这是因为不同实例规格所采用的处理器存在差异,其底层架构也各不相同,比如常见的X86计算架构和Arm计算架构。正因如此,不同实例的云服务器在性能表现以及适用场景方面都各有特点。为了帮助大家在众多实例中做出更合适的选择,本文将针对阿里云服务器的经济型、通用算力型、计算型、通用型和内存型实例,介绍它们的性能特性以及对应的使用场景,以供大家参考和选择。
|
1月前
|
机器学习/深度学习 算法 数据挖掘
基于WOA鲸鱼优化的BiLSTM双向长短期记忆网络序列预测算法matlab仿真,对比BiLSTM和LSTM
本项目基于MATLAB 2022a/2024b实现,采用WOA优化的BiLSTM算法进行序列预测。核心代码包含完整中文注释与操作视频,展示从参数优化到模型训练、预测的全流程。BiLSTM通过前向与后向LSTM结合,有效捕捉序列前后文信息,解决传统RNN梯度消失问题。WOA优化超参数(如学习率、隐藏层神经元数),提升模型性能,避免局部最优解。附有运行效果图预览,最终输出预测值与实际值对比,RMSE评估精度。适合研究时序数据分析与深度学习优化的开发者参考。
|
22天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化的BiLSTM双向长短期记忆网络序列预测算法matlab仿真,对比BiLSTM和LSTM
本项目基于MATLAB2022a/2024b开发,结合粒子群优化(PSO)算法与双向长短期记忆网络(BiLSTM),用于优化序列预测任务中的模型参数。核心代码包含详细中文注释及操作视频,涵盖遗传算法优化过程、BiLSTM网络构建、训练及预测分析。通过PSO优化BiLSTM的超参数(如学习率、隐藏层神经元数等),显著提升模型捕捉长期依赖关系和上下文信息的能力,适用于气象、交通流量等场景。附有运行效果图预览,展示适应度值、RMSE变化及预测结果对比,验证方法有效性。
|
27天前
|
算法 JavaScript 数据安全/隐私保护
基于遗传算法的256QAM星座图的最优概率整形matlab仿真,对比优化前后整形星座图和误码率
本内容展示了基于GA(遗传算法)优化的256QAM概率星座整形(PCS)技术的研究与实现。通过Matlab仿真,分析了优化前后星座图和误码率(BER)的变化。256QAM采用非均匀概率分布(Maxwell-Boltzman分布)降低外圈星座点出现频率,减小平均功率并增加最小欧氏距离,从而提升传输性能。GA算法以BER为适应度函数,搜索最优整形参数v,显著降低误码率。核心程序实现了GA优化过程,包括种群初始化、选择、交叉、变异等步骤,并绘制了优化曲线。此研究有助于提高频谱效率和传输灵活性,适用于不同信道环境。
48 10

热门文章

最新文章

相关产品

  • 云服务器 ECS