国产CPU 申威1621 异数OS基础组件理论性能测试报告

简介: 国产CPU 申威1621 异数OS基础组件理论性能测试报告 文章目录 国产CPU 申威1621 异数OS基础组件理论性能测试报告 前言 测试平台 测试项目 SW1621 异数OS 容器虚拟交换机模拟性能测试 分数与...
+关注继续查看

国产CPU 申威1621 异数OS基础组件理论性能测试报告

前言

一直以来,异数OS都希望能够支援国产CPU生态的建设,这次机缘来到来到成都申威,看到了传说中的申威CPU,并做了异数OS基础组件的理论测试,在此感谢成都申威提供的SW 1621测试环境,期望国产CPU能走上市场化发展的正轨,进入民用领域,从此摆脱舆论束缚,让市场锤炼出民族的英雄与战士。

测试平台

CPU SW1621 4 node 每node 4cpu,主频1.6GHz,8通道64G DDR3。

测试项目

  1. SW1621 异数OS 容器虚拟交换机模拟性能测试
  2. SW1621 异数OS TCP协议栈理论性能模拟测试

SW1621 异数OS 容器虚拟交换机模拟性能测试

A->B->C->A 三节点回环转发
异数OS虚拟交换机模块 三核 跨核以及本地模式
本地模式中ABC三个节点都在本地CPU核完成回环三个操作由本地核完成。
跨核模式中ABC三个节点分别分配到3个不同cpu核完成。
本地转发性能主要影响异数OS集群本地系统内容器间网络交换性能。
跨核模式主要影响异数OS集群本地系统之间容器间网络交换性能。

分数与意义说明

SW1621本地转发 1400字节转发的分数是600kpps*15*3 600kpps是指单位时间内完成一次A->B->C->A回环操作的次数,*15是指15CPU核实例,*3指一次回环转发操作的数量(A->B->C->A 一次回环3次转发)。
跨核由于ABC都需要占用一个CPU节点因此只有5个实例,分数是*5

在这里插入图片描述

SW1621 异数OS TCP协议栈理论性能模拟测试

单核环境
创建1000W TCP session.
新建性能 2.9M(I7 2680QM 2.6G 5.2M)
随机查询性能 3.1M(I7 2680QM 2.6G 15M)

测试总结

申威CPU跨核带宽最大7.5GB/s(3*5核),本地模式36GB/s (3*15核) 大于128字节时IO性能下降明显。
申威给的STREAM测试成绩使用MP技术,STREAM的任务是无交叉关联的,任务可多核无关并发分配,因此MP可编译期任务划分到本地线程,运行时内存拷贝使用本地CPU内存拷贝模式,因此不具有跨核内存拷贝参考意义。
如果需要测试多核交叉互联拷贝性能,测需要改变STREAM代码,如下
//原来的代码
void tuned_STREAM_Copy()
{
ssize_t j;
#pragma omp parallel for
for (j=0; j<STREAM_ARRAY_SIZE; j++)
c[j] = a[j];
}
//改造为跨核访问的代码
void tuned_STREAM_Copy()
{
ssize_t j;
#pragma omp parallel for
for (j=0; j<STREAM_ARRAY_SIZE; j++)
c[j] = a[rand(j)];
}

推测跨核模式由于CPU内联交换总线延迟较大,吞吐下降,未来实用环境中使用异数OS多隧道交换技术吞吐可能会有改善(测试程序只有1并发隧道)

初步数据分析,申威1621可以满足Xnign-X1的性能需求,异数OS TCP协议栈7层IO密集型应用性能预计15核可达到1400字节200W IOPS(20Gbps带宽) 或者64字节15M IOPS(10Gbps带宽),未来numa内存调校优化后,预计可以满足Xnign-X2的硬件需求,配合异数OS在5G领域开发定制产品应该会有不错的竞争力,实现直线超车。
(Xnign-X1的http性能相当于intel全家cpu+linux+nginx性能的20倍)。

下面是Xnign产品性能参数介绍
https://blog.csdn.net/AthlonxpX86/article/details/85279871

测试程序运行结果图

1.15核512字节本地交换
在这里插入图片描述

2.TCP Session模拟测试
在这里插入图片描述

相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
1月前
|
消息中间件 存储 缓存
计算机操作系统学习笔记(3)——CPU缓存一致性
计算机操作系统学习笔记(3)——CPU缓存一致性
103 0
|
2月前
|
Shell
编写脚本/root/bin/systeminfo.sh,显示当前主机系统信息,包括主机名,IPv4地址,操作系统版本,内核版本, CPU型号,内存大小,硬盘大小。
编写脚本/root/bin/systeminfo.sh,显示当前主机系统信息,包括主机名,IPv4地址,操作系统版本,内核版本, CPU型号,内存大小,硬盘大小。
36 0
|
3月前
|
算法 Linux 调度
【操作系统--CPU调度算法】Linux环境中C语言详解(附代码)
操作系统之CPU调度算法,使用C语言实现,可运行在linux环境中
111 0
|
4月前
|
程序员 编译器 Linux
OS - 计算机组成原理及CPU主频揭秘
OS - 计算机组成原理及CPU主频揭秘
62 0
|
4月前
|
机器学习/深度学习 传感器 Linux
【操作系统】CPU平均负载和使用率
【操作系统】CPU平均负载和使用率
【操作系统】CPU平均负载和使用率
|
4月前
|
存储 弹性计算 固态存储
【操作系统】计算机大脑CPU
【操作系统】计算机大脑CPU
【操作系统】计算机大脑CPU
|
4月前
|
存储 缓存 人工智能
图解操作系统-cpu cache
不同物理器件的访问速度不一:速度快的代价高、容量小;代价低且容量大,速度较慢。 为充分发挥各种器件优点,计算机存储数据的物理器件不会只选择一种,而是以CPU为核心,由内而外地组建一整套存储体系结构。它将各种不同的器件组合成一个体系,让各种器件扬长避短,从而形成一种快速、大容量、低成本的内存系统。 写高性能程序,须理解存储体系结构并运用好。
72 0
|
6月前
|
存储 开发框架 弹性计算
阿里云服务器实例规格+内存+CPU+带宽+操作系统等配置选择建议
对于使用阿里云服务器的用户来说,云服务器的选择和使用非常重要,如果实例、内存、CPU、带宽等配置选择错误,可能会影响到自己业务在云服务器上的计算性能及后期运营状况,那么用户选阿里云服务器要把握好哪几个点呢?本文简单介绍一下阿里云服务器实例规格+内存+CPU+带宽+操作系统等配置的选择思路及建议。
阿里云服务器实例规格+内存+CPU+带宽+操作系统等配置选择建议
|
7月前
|
消息中间件 存储 缓存
【操作系统入门到成神系列 五】CPU 是如何执行任务的
【操作系统入门到成神系列 五】CPU 是如何执行任务的
【操作系统入门到成神系列 五】CPU 是如何执行任务的
|
7月前
|
消息中间件 存储 缓存
【操作系统入门到成神系列 四】CPU缓存一致性
【操作系统入门到成神系列 四】CPU缓存一致性
【操作系统入门到成神系列 四】CPU缓存一致性
推荐文章
更多