倚天ECS加速国密算法性能

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 倚天ECS是阿里云基于平头哥自研数据中心芯片倚天710推出arm架构实例,采用armv9架构,支持SM3/SM4指令,可以加速国密算法性能。本文基于OpenSSL 3.2和Tongsuo 实测对比了倚天ECS g8y实例和Intel g7 实例国密性能。为用户选择ECS提供参考。

引言

国密算法,是由国家密码管理局认定和公布的密码算法标准及其应用规范,包括SM1、SM2、SM3、SM4、SM7、SM9和祖冲之密码算法(ZUC)等。国密算法与国际通用算法对应关系如下所示:

算法分类

国际通用算法

国密算法

对称算法

AES、DES、3DES、RC4等等

SM1、SM4、SM7、ZUC

非对称算法

RSA、DSA、DH、ECDSA、ECDH等等

SM2SM9

杂凑算法

SHA1、SHA2、MD5等等

SM3

认证加密

AES-GCM、AES-CCM等等

SM4-GCM、SM4-CCM

其中,SM2、SM3、SM4、SM4-GCM算法应用较为广泛,如政务信息、经济信息、企事业内部敏感信息的加密、网络安全认证、网上银行、数字签名等方面。这几种常用国密算法已经公开并已商用,且在开源OpenSSL中得到实现,目前实现国密算法的开源软件还有GmSSL、Tongsuo等。除了软件层实现国密算法外,还有许多硬件厂商在PCIe标卡或SOC内集成了国密算法,通过硬件卸载方式提升国密算法的安全和性能。

倚天ECS国密性能

倚天ECS是阿里云基于平头哥自研数据中心芯片倚天710推出arm架构实例,采用armv9架构,支持SM3/SM4指令,可以加速国密算法性能。铜锁(Tongsuo)是阿里巴巴对外开源的基础密码库,为存储、网络、密钥管理、隐私计算等诸多业务场景提供底层的密码学基础能力本文将基于OpenSSL 3.2和Tongsuo 实测对比了倚天ECS g8y实例和Intel g7 实例国密性能。

被测ECS实例类型配置如下:

Processor

ECS type

倚天710

g8y.8xlarge

x86处理器

g7.8xlarge

操作系统和gcc版本如下:

GCC version

10.2.1 20200825 (Alibaba 10.2.1-3 2.32)

Operating System

Alibaba Cloud Linux 3.2104 LTS

硬件信息可以通过lscpu查看

[root@Yitian]# lscpu
Architecture:        aarch64
Byte Order:          Little Endian
CPU(s):              32
On-line CPU(s) list: 0-31
Thread(s) per core:  1
Core(s) per cluster: 8
Socket(s):           1
Cluster(s):          1
NUMA node(s):        1
Vendor ID:           ARM
BIOS Vendor ID:      Alibaba Cloud
Model:               0
BIOS Model name:     virt-rhel7.6.0
Stepping:            r0p0
BogoMIPS:            100.00
NUMA node0 CPU(s):   0-31
Flags:               fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma lrcpc dcpop sha3 sm3 sm4 asimddp sha512 sve asimdfhm dit uscat ilrcpc flagm ssbs sb dcpodp sve2 sveaes svepmull svebitperm svesha3 svesm4 flagm2 frint svei8mm svebf16 i8mm bf16 dgh
[root@Yitian]#

SM2非对称算法性能

SM2算法基于椭圆曲线(ECC)算法,包含数字签名,公钥加解密,密钥交换。相对于RSA算法,SM2密码强度比2048位的RSA密码强度要高,速度更快。SM2算法在嵌入式领域签名验签应用较多。

SM2性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed sm2

加密库

SM2

sign/s

verify/s

Tongsuo

g7

10910.5

12750.2

g8y

27213.1

28727.2

openssl-3.2

g7

10920.4

12830.1

g8y

27425.8

28528.5

image.png

测试结果:SM2算法性能,Tongsuo和openssl3.2测试结果表现一致;签名性能倚天ECS g8y实例是g7的2.49倍;验签性能倚天ECS g8y是g7的2.22倍。

SM3摘要算法性能

SM3算法常用于数字签名和数据完整性保护。算法可以对一定长度的消息,填充和迭代压缩后,生成长度为256比特的散列值,又称“数字指纹”。SM3算法和MD5算法的计算迭代过程类似,采用Merkle-Damgard转换,整个转换执行过程可以概括成四个步骤:消息填充、消息扩展、迭代压缩、输出结果。SM3算法可以应用在数据存储中指纹的生成,数字影音完整性校验等等。

SM3性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm3

加密库

SM3

1K bytes

8K bytes

Tongsuo

g7

889359.02

988383.91

g8y

3851532.97

4265263.10

openssl-3.2

g7

888715.26

983979.35

g8y

3844803.34

4264506.71

image.png

测试结果:SM3算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的计算摘要,倚天ECS g8y实例是g7的4.3倍。

SM4对称算法性能

SM4对称算法用于实现数据的加密/解密运算,以保证数据和信息的机密性。SM4算法与AES算法具有相同的密钥长度、分组长度。SM4算法由加解密算法和密钥扩展算法组成,采用非线性结构,分组长度为128b,密钥长度为128b。SM4主要在网络数据、流媒体的加密保护,以及存储数据或文件的加密保护应用较多。

SM4-CBC性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-cbc

加密库

SM4-CBC

1K bytes

8K bytes

Tongsuo

g7

857721.17

858860.20

g8y

8445351.80

8450402.99

openssl-3.2

g7

857374.04

858852.01

g8y

8437472.60

8452295.34

image.png

测试结果:SM4-CBC算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的加解密,倚天ECS g8y实例是g7的9.84倍。

SM4-CTR性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-ctr

加密库

SM4-CTR

1K bytes

8K bytes

Tongsuo

g7

825366.53

826619.22

g8y

30621407.23

31672524.80

openssl-3.2

g7

825741.99

827034.28

g8y

30596200.79

31688701.27

image.png

测试结果:SM4-CTR算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的加解密,倚天ECS g8y实例是g7的38.3倍。

SM4-XTS性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-xts

加密库

SM4-XTS

1K bytes

8K bytes

Tongsuo

(未支持sm4-xts)

g7

NA

NA

g8y

NA

NA

openssl-3.2

g7

830255.10

837741.23

g8y

7598128.13

7347869.01

image.png

测试结果:SM4-XTS算法性能,8K数据的加解密,倚天ECS g8y实例是g7的8.77倍。

SM4-GCM 认证加密算法性能

GCM(Galois/Counter Mode)是认证加密(AEAD)模式中的一种, 能同时确保数据的保密性、完整性,它还可以提供附加消息的完整性校验。SM4-GCM算法适用场景TLS连接场景,如支持国密算法的浏览器。

SM4-GCM性能测试命令:taskset -c 0-7 ./apps/openssl speed -multi 8 -elapsed -evp sm4-gcm

加密库

SM4-CTR

1K bytes

8K bytes

Tongsuo

g7

894681.43

899358.72

g8y

18692320.94

19156877.31

openssl-3.2

g7

894615.89

899618.13

g8y

18686604.63

19151476.05

image.png

测试结果:SM4-GCM算法性能,Tongsuo和openssl3.2测试结果表现一致; 8K数据的加解密,倚天ECS g8y实例是g7的21.2倍。

总结

本文基于OpenSSL 3.2和Tongsuo 测试对比了倚天ECS g8y实例和Intel g7实例几个常用的国密算法性能。可以看到g8y实例性能全面领先于g7,这要得益倚天g8y强大的多核物理核心,先进的armv9架构。另外我们也看到阿里巴巴开源的Tongsuo加密库和OpenSSL 3.2的性能表现结果一致,对于那些依赖OpenSSL1.1加密的应用来说,Tongsuo不失为一个优秀高性能加密库替代产品。此外,倚天g8y实例售价比g7实例低23%,是极具性价比的一款云计算实例产品。

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
26天前
|
存储 运维 资源调度
阿里云服务器经济型e实例解析:性能、稳定性与兼顾成本
阿里云经济型e云服务器以其高性价比、稳定可靠的性能以及灵活多样的配置选项,成为了众多企业在搭建官网时的首选。那么,阿里云经济型e云服务器究竟怎么样?它是否能够满足企业官网的搭建需求?本文将从性能表现、稳定性与可靠性、成本考虑等多个方面对阿里云经济型e云服务器进行深入剖析,以供大家参考选择。
106 37
|
27天前
|
存储 人工智能 安全
阿里云服务器五代、六代、七代、八代实例简介及性能提升介绍参考
随着技术的不断进步,阿里云服务器实例也经历了多代升级,从五代实例到最新的八代实例,每一代都在性能、稳定性、能效比等方面取得了显著提升。有的用户由于是初次接触阿里云服务器,所以不是很清楚阿里云服务器五代、六代、七代、八代实例有哪些,它们各自在云服务器性能上有哪些提升。本文将详细介绍阿里云服务器五代、六代、七代、八代实例的特点及性能提升,以供了解及选择。
阿里云服务器五代、六代、七代、八代实例简介及性能提升介绍参考
|
1月前
|
存储 安全 数据安全/隐私保护
阿里云服务器五代、六代、七代、八代实例简介及性能提升介绍
随着技术的不断进步,到2025年,阿里云服务器实例也经历了多代升级,从五代实例到最新的八代实例,每一代都在性能、稳定性、能效比等方面取得了显著提升。有的用户由于是初次接触阿里云服务器,所以不是很清楚阿里云服务器五代、六代、七代、八代实例有哪些,它们各自在云服务器性能上有哪些提升。本文将详细介绍阿里云服务器五代、六代、七代、八代实例的特点及性能提升,帮助用户更好地了解并选择适合自己的云服务器实例。
132 29
|
1月前
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
260 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
21天前
|
存储 弹性计算 固态存储
阿里云服务器ESSD Entry系统盘测评IOPS、IO读写和时延性能参数
阿里云ESSD Entry云盘是新一代企业级云盘,具备高IOPS、低延迟特性,适合开发与测试场景。它提供10~32,768 GiB容量范围,最大IOPS达6,000,吞吐量150 MB/s,时延1~3 ms。支持按量付费和包年包月,性价比高,特别适合个人开发者和中小企业。详情及价格参考阿里云官网。
|
21天前
|
存储 弹性计算 网络协议
深度对比阿里云服务器ECS通用型g7、g7a、g8i、g8y、g8ise和g8a性能对比
阿里云通用型ECS云服务器(g7、g7a、g8i、g8y、g8ise和g8a)具有1:4的CPU内存比,适合多种应用场景。配置从2核8G到128核512G不等,基于第三代神龙架构或CIPU架构,采用Intel、AMD及自研倚天710处理器,主频在2.55 GHz至3.7 GHz之间。支持IPv4/IPv6,具备高网络收发包PPS能力,适用于企业级应用、数据库、Web服务、AI训练、音视频处理等场景。I/O优化实例仅支持ESSD云盘,确保高性能存储。
|
21天前
|
存储 弹性计算 数据挖掘
阿里云服务器ECS通用算力型u1和ECS经济型e实例性能特点、使用及常见问题解答FAQ
阿里云ECS云服务器的经济型e实例和通用算力型u1实例深受开发者和中小企业青睐。e实例适合中小型网站、开发测试等轻量级应用,采用共享CPU调度模式,性价比高;u1实例则适用于中小型企业级应用,提供更高的性能保障和稳定性,支持固定CPU调度模式,计算性能更稳定。同等配置下,u1实例在网络带宽、IOPS等方面表现更优,价格也相对较高。个人用户可选择e实例,中小企业建议选择u1实例以确保业务稳定性。
|
1月前
|
存储 人工智能 网络协议
浅聊阿里云倚天云服务器:c8y、g8y、r8y实例性能详解与活动价格参考
选择一款高性能、高性价比的云服务器对于企业而言至关重要,阿里云推出的倚天云服务器——c8y、g8y、r8y三款实例,它们基于ARM架构,采用阿里自研的倚天710处理器,并基于新一代CIPU架构,通过芯片快速路径加速手段,实现了计算、存储、网络性能的大幅提升。2025年,计算型c8y云服务器活动价格860.65元一年起,通用型g8y云服务器活动价格1187.40元一年起,内存型r8y云服务器活动价格1454.32元一年起。本文将为大家详细解析这三款实例的性能特点、应用场景以及最新的活动价格情况,帮助大家更好地了解阿里云倚天云服务器。
|
2月前
|
存储 分布式计算 安全
阿里云服务器经济型、通用算力型、计算型、通用型各主要实例性能、适用场景对比
在阿里云目前的活动中,云服务器实例规格有几大类,分别是轻量应用服务器、经济型e实例、通用算力型u1实例,第七代计算型c7、通用型g7、内存型r7实例,第八代计算型c8i、通用型g8i、内存型r8i实例,倚天云服务器实例计算型c8y、通用型g8y、内存型r8y实例,不同类型的实例规格,性能和适用场景不同,本文将这些热门实例规格的性能和适用场景全部展示出来,以供大家做对比和选择参考,从而选择出适合自己需求的云服务器实例规格。
|
2月前
|
存储 弹性计算 数据挖掘
阿里云服务器e实例和u1实例有什么区别?ECS经济型和通用算力性能特性及优势详解
阿里云ECS云服务器的经济型e实例和通用算力型u1实例在性能、适用场景和价格上各有优势。e实例适合个人开发者和轻量级应用,性价比高;u1实例则更适合中小企业,提供更稳定的性能和更高的网络带宽。选择时可根据具体需求和预算进行决策。

相关产品

  • 云服务器 ECS