为 Lambda 语法增加序运算能力

简介: 本文探讨了集合运算中与次序相关的Lambda语法。SQL基于无序集合概念,不关注遍历时的次序,但计算机执行时总有顺序。SPL引入`#`表示遍历次序号,简化了如取前半成员、偶数位置成员等操作。此外,SPL支持相邻成员引用(如`~[-1]`表示前一个成员),方便计算增长率、移动平均值等。相比SQL需用子查询或窗口函数,SPL的有序Lambda语法更简洁高效,增强了集合运算的描述能力。

我们继续讨论集合运算中的 Lamba 语法,引入和次序相关的运算能力。

SQL 延用了数学上的无序集合概念,遍历集合时也不关注次序。但计算机只能一步步地执行,循环时总会有个次序,充分利用这个次序就可以方便地表达更丰富的计算需求。
比如我们想从一个集合取出半数成员构成新集合。这看起来象是过滤运算,但过滤条件和集合成员本身并没有关系,而是由循环时的次序号决定的。

SPL 中只用 ~ 写法还无法方便地描述出这种运算,这时候还需有个符号(标识符)来表示循环的次序号。这是 Lambda 语法的第四条。

事实上,大部分高级语言在写循环语句时都会有个循环变量来表示次序号,就起到了这个作用。但在 Lambda 语法中并没有提供这个机制,碰到这种运算就只能再写循环或人为造个序号序列才能完成,就显得很繁琐。SQL 也没有表示遍历次序号的方案,只能先用子查询人为制造一个序号出来再针对这个序号进行过滤。

SPL 用 #来表示遍历的次序号,那么这个运算就很容易写了:

A.select(#<=A.len()/2)        取前一半成员
A.select(#%2==0)        取偶数位置的成员

对应地,在过滤运算中一般总是返回满足条件的成员,但有时候我们并不关心具体成员而只关心成员的次序号,SPL 中还设计返回次序号的过滤函数:

A.pselect( ~>5 )        返回大于5的成员的次序号

类似地,还可能有:

A.pmax()            返回最大值的次序号

...

关于这些位置相关的运算,我们以后还会专门讲。

考虑到集合上遍历的次序时,我们还可以进一步丰富计算的描述能力。
比如有 12 个月的销售额数据已经按次序准备好,要计算哪些月份的增长率超过了 5%。
SQL 写这种跨行计算比较麻烦,需要用 JOIN 或窗口函数把上月数据和本月数据对齐,然后再来计算增长率,这不可避免地用到子查询。
如果提供了相邻成员的引用语法,就可以很容易描述这个计算了。
SPL 中用 [i] 表示和当前成员距离为 i 的成员,再结合前述的 #写法,上面的计算就可以写成:

A.(if(~/~[-1]>1.05,#,0)).select(~>0)

~[-1] 表示前一个成员,也就是上月销售额。找出把增长率超过 5% 的月份(也就是 #),其它月份清 0,最后选出这些非 0 的月份。
如果用上述的返回次序号的过滤函数,还可以写成更简单的形式:

A.pselect(~/~[-1]>1.05)

除了相邻成员外,还可能有相邻集合的引用,比如还是上面的集合,我们希望计算前后各一个月的销售额移动平均值。
SPL 把 [i] 表达式扩展成 [a,b] 写法来表示相邻成员构成的集合,这个运算就很容易描述了:

A.(~[-1,1].avg())
相邻集合还可能有更复杂的情况,比如计算到当月的累积销售额。
SPL 允许 [a,b] 写法中 a 缺省表示从第一个成员开始(对等地,b 缺省可以理解为最后一个成员),这个运算可以写成

A.(~[,0].sum())

同样的,面向结构化数据计算也还可以直接使用字段名,如果例子中的集合是由“月份”和“销售额”的两个字段构成的表,则上述的运算可以分别写成:

A.select(amount/amount[-1]>1.05)            这里结果集中已有月份字段,不再需要用#了
A.derive(amount[-1,1].avg:move_average)            增加一个字段表示移动平均
A.derive(amount[,0].sum():cum_amount)

考虑到有序性时,Lambda 语法的规则就比常规集合运算要复杂一些,而这些有序运算是经常发生的,如果 Lambda 语法不支持,会导致这些计算难以描述,程序员就要再退回到编写多行循环语句的状态,或者人为造出序号,繁琐且影响可读性。

SQL 没有提供有序的 Lambda 语法,经常需要使用子查询和窗口函数来生成序号,某些复杂些的有序遍历运算甚至写不出来,也要用存储过程手段转换成多行循环语句才可以。从这个意义讲,SQL 虽然有集合化特性,但集合化不够彻底。

Python 提供了局部的序号能力,相邻引用也比较麻烦。SPL 可能是唯一提供较完整有序 Lambda 语法的语言。

SPL已开源免费,欢迎前往乾学院了解更多!

相关文章
|
8月前
|
存储 运维 监控
日志服务SLS焕新升级:卓越性能、高效成本、极致稳定与智能化
日志服务SLS焕新升级,涵盖卓越性能、高效成本、极致稳定与智能化。新功能特性包括Project回收站、ELasticsearch兼容方案及全链路数据处理能力提升。通过扫描计算模式和数据加工优化,实现更好的成本效果。案例分析展示了一家国内顶级车企如何通过日志服务实现跨云、跨地域的全链路数据处理,大幅提升问题处理效率。
193 9
|
Shell Linux 开发工具
"开发者的救星:揭秘如何用adb神器征服Android设备,开启高效调试之旅!"
【8月更文挑战第20天】Android Debug Bridge (adb) 是 Android 开发者必备工具,用于实现计算机与 Android 设备间通讯,执行调试及命令操作。adb 提供了丰富的命令行接口,覆盖从基础设备管理到复杂系统操作的需求。本文详细介绍 adb 的安装配置流程,并列举实用命令示例,包括设备连接管理、应用安装调试、文件系统访问等基础功能,以及端口转发、日志查看等高级技巧。此外,还提供了常见问题的故障排除指南,帮助开发者快速解决问题。掌握 adb 将极大提升 Android 开发效率,助力项目顺利推进。
338 0
|
11月前
|
运维 监控 Serverless
利用Serverless架构优化成本和可伸缩性
【10月更文挑战第13天】Serverless架构让开发者无需管理服务器即可构建和运行应用,实现成本优化与自动扩展。本文介绍其工作原理、核心优势及实施步骤,探讨在Web应用后端、数据处理等领域的应用,并分享实战技巧。
|
8月前
|
监控 数据可视化 数据挖掘
惊叹!燕云十六声运营团队靠它提升工作效率!
在游戏行业竞争激烈的2025蛇年新春,燕云十六声团队通过选择合适的可视化协作软件实现了高效工作。板栗看板以其高度可视化的任务管理、灵活的任务分配和强大的文件管理功能脱颖而出。Trello、Asana、Monday.com、Zeplin和Slack等工具也各具特色,提供了丰富的插件、权限管理和实时沟通等功能,助力团队应对巨大工作量和协作挑战,提升工作效率,打造更优质的游戏产品。
326 12
|
8月前
|
人工智能 算法 测试技术
AI 研发产品进化论:从 AI 编码助手到 AI 程序员
本次分享由阿里云资深技术专家陈鑫主讲,主题为“AI研发产品进化论:从AI编码助手到AI程序员”。内容涵盖通义灵码在落地过程中的挑战与突破,包括精准度提升、企业级检索增强、自定义扩展及智能体的应用。通过全工程理解、个性化适配和智能体的引入,通义灵码已实现代码补全、单元测试生成、缺陷修复等核心功能,并显著提升了开发者的工作效率。目前,通义灵码已在Vs Code和JetBrains插件市场上获得超过500万次下载,月均采纳率超过30%,并持续优化中。
221 9
|
8月前
|
Cloud Native 安全 Serverless
Serverless 应用引擎 SAE:让应用管理如此简单
本次课程由阿里云智能集团高级技术专家赵庆杰分享,主题为“Serverless 应用引擎 SAE:让应用管理如此简单”。课程涵盖四个主要部分:降本增效、功能场景、关键技术与客户案例。SAE 引擎通过按量付费、弹性伸缩等特性简化应用管理,帮助企业将更多精力投入到 AI 应用和业务价值上。SAE 提供了低门槛微服务架构转型、应用快速上云、一键启停环境、高可用方案及 CI/CD 解决方案等功能。此外,还介绍了高等教育出版社使用 SAE 进行云原生改造的案例,展示了其在降本增效、提升研发效能和安全性方面的显著成果。
243 9
|
8月前
|
SQL 存储 Oracle
【YashanDB观点】论Oracle兼容性,我们需要做什么
Oracle兼容性是目前国产数据库的关键任务之一,其直接影响到商业迁移的成本和竞争力。
135 8
|
11月前
|
自然语言处理 搜索推荐 程序员
【Python】如何使用pip,安装第三方库和生成二维码、操作Excel
【Python】如何使用pip,安装第三方库和生成二维码、操作Excel
222 0
|
前端开发 算法 JavaScript
Golang 语言 Web 框架 beego v2 之模板(下)
Golang 语言 Web 框架 beego v2 之模板(下)
176 0
|
算法 安全 区块链
一文说明白ECDSA secp256k1 secp256r1 EdDSA ed25519千丝万缕的关系
文章深入探讨了ECDSA和EdDSA两种数字签名算法及其具体实现secp256k1、secp256r1和ed25519之间的联系和区别,分析了ECDSA的安全性问题和EdDSA的改进,以及它们在加密货币和区块链技术中的应用。
859 0
一文说明白ECDSA secp256k1 secp256r1 EdDSA ed25519千丝万缕的关系