【其他】快出数量级的性能是怎样炼成的

简介: SPL基于的理论基础不再是关系代数,而是我们发明的**离散数据集**。在这个体系下有更多的数据类型和运算,就能写出更多高性能算法了。SPL是离散数据集的一种实现,封装了许多现成的算法。用Java和C++当然也能从头来实现这个代数体系,因而都能写出来高性能代码

📫 作者简介:No8g攻城狮,热衷分享,喜欢原创~ 关注我会给你带来一些不一样的认知和成长,专注于研究 Java/Spring/SpringBoot/大数据/计算机底层原理/源码,就职于大型物联网公司后端高级工程师,擅长物联网领域的高安全/可用/并发/性能的架构设计与演进、系统优化与稳定性建设。📫

🏆 CSDN认证博客专家博主/后端领域优质创作者/内容合伙人、阿里云/华为云/签约博主、InfoQ/掘金社区/OSCHINA签约作者,全网7万多粉丝支持! 🏆

🔥 如果此文还不错的话,还请👍点赞、关注、收藏三连支持👍一下博主~ 十分感谢,发布的博客会不定期送书的福利哈~ 🔥



我们之前做过一些性能优化的案例,不算很多,还没有失手过。少则提速数倍,多则数十倍,极端情况还有提速上千倍的。提速一个数量级基本上是常态。下面是一些案例材料:

[开源 SPL 提速保险公司团保明细单查询 2000+ 倍](http://c.raqsoft.com.cn/article/1593677551526)  

[开源 SPL 提升银行自助分析从 5 并发到 100 并发](http://c.raqsoft.com.cn/article/1594819716739)  

[开源 SPL 提速银行用户画像客群交集计算 200+ 倍](http://c.raqsoft.com.cn/article/1597304345472)  

[开源 SPL 优化银行预计算固定查询成实时灵活查询](http://c.raqsoft.com.cn/article/1593424083742)  

[开源 SPL 将银行手机账户查询的预先关联变成实时关联](http://c.raqsoft.com.cn/article/1595490353934)  

[开源 SPL 提速银行资金头寸报表 20+ 倍](http://c.raqsoft.com.cn/article/1595292374988)  

[开源 SPL 提速银行贷款协议跑批 10+ 倍](http://c.raqsoft.com.cn/article/1596098387752)  

[开源 SPL 优化保险公司跑批优从 2 小时到 17 分钟](http://c.raqsoft.com.cn/article/1594119021002)  

[开源 SPL 提速银行 POS 机交易报表 30+ 倍](http://c.raqsoft.com.cn/article/1596352109236)  

[开源 SPL 提速银行贷款跑批任务 150+ 倍](http://c.raqsoft.com.cn/article/1594371863322)  

[开源 SPL 提速资产负债表 60 倍](http://c.raqsoft.com.cn/article/1598521512181)  

这是怎么做到的呢?  

这些被提速的场景都有一个共同点:原先都是用各种数据库(也有HADOOP/Spark)上的SQL实现的,包括查询用的几百行SQL也有跑批用的几千行存储过程,然后我们改用集算器的SPL重新实现之后就有了这样的效果。  

集算器SPL有什么神奇之处?是不是能让各种运算跑得更快?  

有点遗憾,并没有这样的好事。集算器也是一个软件,而且是用Java写的,完成同样运算通常比C/C++写的数据库还要慢一点。  

那是怎么回事?

根本原因在于我们用SPL实现了不同的算法。软件不能提高硬件的速度,但我们可以设计出更低复杂度的算法,有效地减少计算量,然后速度自然就上去了。一个运算任务本来要做1亿次加法,如果能减到100万次,那自然就能快100倍,即使每次运算都变得稍慢一点,总体性能仍然会提高,这一点也不神奇。  

只要能实现高性能算法和存储,用什么技术来做并不重要了。用C/C++、Java当然都能做出来。事实上,集算器是用Java写的,用Java直接实现这些算法原则上还会更快一点,用C/C++ 一般还能更快(Java的内存分配消耗时间还是有点多)。  

不过,虽然用Java和C++能写出比SPL更快的代码,但要长得多(估计会长出50-100倍),这会导致开发工作量过大,这在实际应用时也是要权衡的一个指标。有时候,跑得快和写着简单其实是一回事,就是能高效率地实现高性能算法。  

集算器的SPL中强化了结构化数据的数据类型,并提供了很多基础的高性能算法。写代码就是组合运用这些算法,当然会方便得多。要说神奇之处,也就是这一点了。  

那么,继续SQL就不能做到同样的事吗?  

是的。SQL设计得过于粗线条,关系代数这个理论基础中缺乏很多数据类型和基础运算,很多高性能算法都无法描述,结果只能使用慢算法。虽然现在很多数据库和大数据平台都在工程上有所优化,但也只能针对简单的场景,情况复杂之后数据库的优化器都会“晕”掉,所以解决不了根本问题。这是个理论上的问题,无法在工程层面解决。  

SPL基于的理论基础不再是关系代数,而是我们发明的**离散数据集**。在这个体系下有更多的数据类型和运算,就能写出更多高性能算法了。SPL是离散数据集的一种实现,封装了许多现成的算法。用Java和C++当然也能从头来实现这个代数体系,因而都能写出来高性能代码。而SQL却不可以。

举个简单的例子,我们想在1亿条数据中取出前10名,用SQL写出来是这样的:

```sql

select top 10 x,y from T order by x desc

```

这个语句中有个order by,严格按它执行就会涉及大排序,而排序非常慢。其实我们可以想出一个不用大排序的算法,但用SQL却无法描述,只能指望数据库优化器了。对于这句SQL描述的简单情况,很多商用数据库确实都能优化,使用不必大排序的算法,性能通常很好。但情况复杂一些,比如在每个分组中取前10名,要用窗口函数和子查询把SQL写成这样:

```sql

select * from

   (select y,*,row_number() over (partition by y order by x desc) rn from T)

where rn<=10

```

这时候,数据库优化器就会犯晕了,猜不出这句SQL的目的,只能老老实实地执行排序的逻辑(这个语句中还是有order by的字样),结果性能陡降。  

而SPL不一样,离散数据集中有普遍集合的概念,TopN这种运算被认为是和SUM和COUNT一样的聚合运算,只不过返回值是个集合而已。这时候写出来的取前10名的语句中并没有排序动作:  

```sql

T.groups(;top(-5;x))

```

分组后的写法也很简单,都不需要执行大排序:

```sql

T.groups(y;top(-5;x))

```

这里 [性能优化技巧:TopN](http://c.raqsoft.com.cn/article/1568974653153) 还有关于这个问题的更详细测试对比。

所以,我们做性能优化时要重写代码,不能继续使用SQL保持兼容。要读懂原来的逻辑重新实现,这个工作量还是很大的,不过能换来数倍数十倍的性能提升,常常还是值得的。  

另外,存储也非常重要,好算法要有合适的存储机制配合才能生效,所以不能继续把数据继续存在数据库里获得高性能,需要搬出来换种办法组织存放。改变存储后,有可能把原来需要缓存的计算过程变成不需要了,原来要遍历多遍的运算变成只遍历一次甚至不用遍历了,减少硬盘访问量对性能的提升非常有效。

从上面这个原理上看,如果我们不能针对计算目标设计出更好的算法,那就做不到提速了。比如一个很简单的大表求和,用SQL要做1亿次,用SPL也要做1亿次,那就不可能做得更快,一般还会更慢一点(Java赶不上C/C++)。但是,当运算任务足够复杂时,碰到几百上千行的嵌套N层SQL(慢的SQL通常也不会太简单),几乎总能找到足够多可优化的环节,所以我们经历过的案子还没有失手过。结果,在实践上用Java写出来集算器大幅度超越了C/C++写的数据库,这都是算法造就的。  

我们甚至曾经发过一个广告    [慢得受不了的查询跑批](http://www.raqsoft.com.cn/wx/Query-run-batch-ad.html)

寻找用SQL写的慢过程,我们负责提速一个数量级。

换个角度再看这个提速原理:**高性能靠的不是代码,而是代数**,代码只是个实现手段而已。其中最关键的是掌握和运用这些算法,而不是SPL语法。SPL语法很简单,比Java容易多了,两小时就能基本上手,两三周就能比较熟练了。但算法却没那么简单,需要认真学习反复练习才能掌握。这些案例直接由没有经验的用户自己做常常效果并不好,主要原因也是对算法没有吃透。  

反过来,而只要掌握了算法,用什么语法就是个相对次要的问题了(当然用SQL这种太粗线条的语言还是不行)。这就像给病人看病,找出病理原因后,能分析出什么成分的药能管用。无论直接购买成药(使用封装过的SPL),还是上山采药(使用Java/C++硬写),都可以治好病,无非就是麻烦程度和支付成本不同。  

 

可能有读者对SPL提供了哪些与SQL不同的高性能算法感兴趣,推荐一下乾学院上的性能优化图书      [【性能优化】 前言及目录](http://c.raqsoft.com.cn/article/1613911172557)  和视频课程    [《性能优化》课程](http://www.raqsoft.com.cn/wx/course-performance-optimizing.html)  

我们已经把这些算法都整理成有体系的知识了。有些算法是业界首创的,其它教科书和论文中都找不到。  

跟着这些图书课程学习,掌握这些算法后,就可以自己写到快出数量级的高性能代码。即使自己不写代码,也能理解原理,不会再被很多大数据产品喊什么“万亿秒查”的说法忽悠了。  

## SPL资料

- [SPL官网](<http://c.raqsoft.com.cn/article/1595816810031>)  

- [SPL下载](<http://c.raqsoft.com.cn/article/1595816810031>)  

- [SPL源代码](<https://github.com/SPLWare/esProc>)  





`**本文首发于CSDN,为博主原创文章,如果需要转载,请注明出处,谢谢!**`

相关文章
|
SQL 算法 Java
【其他】快出数量级的性能是怎样炼成的
【其他】快出数量级的性能是怎样炼成的
46 0
|
1月前
|
SQL 算法 Java
快出数量级的性能是怎样炼成的
我们通过使用开源 SPL 重写了多个金融行业的 SQL 任务,实现了显著的性能提升,如保险公司团保明细单查询提速 2000+ 倍、银行 POS 机交易报表提速 30+ 倍等。这些优化的核心在于使用了更低复杂度的算法,而非依赖硬件加速。SPL 基于离散数据集理论,提供了丰富的高性能算法,使得复杂任务的优化成为可能。更多案例和详细技术解析可参见乾学院的相关课程和图书。
|
7月前
|
自然语言处理 算法
LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律!
【2月更文挑战第27天】LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律!
66 2
LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律!
|
7月前
|
缓存 Dubbo 应用服务中间件
实现从10s到0.5s的飞跃,揭秘性能提升的秘诀
在数字时代,性能优化对各类技术系统和应用至关重要,关乎用户体验、效率和成本。某团队在面对系统响应慢的问题时,通过梳理逻辑、使用stopwatch排查,发现了数据库、连接池、日志打印和Dubbo配置等问题。他们优化了数据库的索引和锁机制,减少了日志打印的负担,调整了Dubbo的线程配置,并改进了日志组件,最终显著提升了系统性能。性能优化的方法包括代码优化、数据库优化、缓存技术、并发处理和资源管理,这是一个持续且需综合考虑稳定性和可靠性的过程。
62 2
|
7月前
|
人工智能 芯片 异构计算
GPU震撼发布:性能飙升,功耗惊人,液冷成新宠?
Blackwell推出新一代GPU,性能比H100提升5倍,浮点运算速度惊人,但最高1200W功耗需液冷散热。产品线包括B100、B200和GB200超级芯片,后者结合72核CPU,计算性能达40petaflops,内存384GB。新NVLink技术助力GB200构建NVL72系统,可处理27万亿参数的AI模型。
59 1
|
7月前
|
缓存 安全 前端开发
5分钟,我把网站性能优化了3倍
5分钟,我把网站性能优化了3倍
|
机器学习/深度学习 计算机视觉
模型大十倍,性能提升几倍?谷歌研究员进行了一番研究
模型大十倍,性能提升几倍?谷歌研究员进行了一番研究
180 0
|
缓存 人工智能 并行计算
小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增
小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增
503 0
|
存储 前端开发 安全
tegg v3 - 性能飞跃
tegg v3 - 性能飞跃
249 0
|
机器学习/深度学习 人工智能 分布式计算
全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍
全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍
129 0