MongoDB是NoSQL数据库的典型代表,支持文档结构的存储方式数据存储和使用更为便捷,数据存取效率也很高,但计算能力较弱,实际使用中涉及MongoDB的计算尤其是复杂计算会很麻烦,这就需要具备强计算能力的数据处理引擎与其配合。
开源集算器SPL是一款专业结构化数据计算引擎,拥有丰富的计算类库和完备、不依赖数据库的计算能力。SPL提供了独立的过程计算语法,尤其擅长复杂计算,可以增强MongoDB的计算能力,完成分组汇总、关联计算、子查询等通通不在话下。
常规查询
MongoDB不容易搞定的连接JOIN运算,用SPL很容易搞定:
A | B | |
1 | =mongo_open("mongodb://127.0.0.1:27017/raqdb") | /连接MongDB |
2 | =mongo_shell(A1,"c1.find()").fetch() | /获取数据 |
3 | =mongo_shell(A1,"c2.find()").fetch() | |
4 | =A2.join(user1:user2,A3:user1:user2,output) | /关联计算 |
5 | >A1.close() | /关闭连接 |
单表多次参与运算,复用计算结果:
A | B | |
1 | =mongo_open("mongodb://127.0.0.1:27017/raqdb") | |
2 | =mongo_shell(A1,“course.find(,{_id:0})”).fetch() | /获取数据 |
3 | =A2.group(Sno).((avg = ~.avg(Grade), ~.select(Grade>avg))).conj() | /计算成绩大于平均值 |
4 | >A1.close() |
IN计算:
A | B | |
1 | =mongo_open("mongodb://localhost:27017/test") | |
2 | =mongo_shell(A1,"orders.find(,{_id:0})") | /获取数据 |
3 | =mongo_shell(A1,"employee.find({STATE:'California'},{_id:0})").fetch() | /过滤employee数据 |
4 | =A3.(EID).sort() | /取出EID并排序 |
5 | =A2.select(A4.pos@b(SELLERID)).fetch() | /二分法查找 |
6 | >A1.close() |
外键对象化,外键指针不仅方便,效率也高:
A | B | |
1 | =mongo_open("mongodb://localhost:27017/local") | |
2 | =mongo_shell(A1,"Progress.find({}, {_id:0})").fetch() | /获取Progress数据 |
3 | =A2.groups(courseid; count(userId):popularityCount) | /按课程分组计数 |
4 | =mongo_shell(A1,"Course.find(,{title:1})").fetch() | /获取Course数据 |
5 | =A3.switch(courseid,A4:_id) | /外键连接 |
6 | =A5.new(popularityCount,courseid.title) | /创建结果集 |
7 | =A1.close() |
APPLY算法的简单实现:
A | B | |
1 | =mongo_open("mongodb://127.0.0.1:27017/raqdb") | |
2 | =mongo_shell(A1,"users.find()").fetch() | /获取users数据 |
3 | =mongo_shell(A1,"workouts.find()").fetch() | /获取workouts数据 |
4 | =A2.conj(A3.select(A2.workouts.pos(_id)).derive(A2.name)) | /查询_id 值workouts 序列的记录 |
5 | >A1.close() |