在MongoDB中使用聚合操作筛选与修改字段-阿里云开发者社区

在MongoDB中使用聚合操作筛选与修改字段

2023-05-19 561

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在MongoDB中使用聚合操作筛选与修改字段

本文摘录自我的书《左手MongoDB，右手Redis 从入门到商业实战》

对图7-1所示的数据集exampledata1，使用聚合操作实现以下功能：

（1）不返回_id字段，只返回age和sex字段。

（2）所有age大于28的记录，只返回age和sex。

（3）在$match返回的字段中，添加一个新的字段“hello”，值为“world”。

（4）在$match返回的字段中，添加一个新的字段“hello”，值复制age的值。

（5）在$match返回的字段中，把age的值修改为一个固定字符串。

（6）把user.name和user.user_id变成普通的字段并返回。

（7）在返回的数据中，添加一个字段“hello”，值为“$normalstring”，再添加一个字段“abcd”，值为1。

“$match”可以筛选出需要的记录，那么如果想只返回部分字段，又应该怎么做呢？这时就需要使用关键字“$project”。

返回部分字段

首先用“$project”来实现一个已经有的功能——只返回部分字段。格式如下：

collection.aggregate([{'$project':{字段过滤语句}}])

这里的字段过滤语句与“find()”第2个参数完全相同，也是一个字典。字段名为Key，Value为1或者0（需要的字段Value为1，不需要的字段Value为0）。

例如，对于图7-1所示的数据集，不返回“_id”字段，只返回age和sex字段，则聚合语句如下：

db.getCollection('example_data_1').aggregate([
    {'$project': {'_id': 0, 'sex': 1, 'age': 1}}
])

查询结果如图7-22所示。

结合“$match”实现“先筛选记录，再过滤字段”。例如，选择所有age大于28的记录，只返回age和sex，则聚合语句写为：

db.getCollection('example_data_1').aggregate([
    {'$match': {'age': {'$gt': 28}}},
    {'$project': {'_id': 0, 'sex': 1, 'age': 1}}
])

查询结果如图7-23所示。

到目前为止，使用“$match”加上“$project”，多敲了几十次键盘，终于实现了“find()”的功能。使用聚合操作复杂又繁琐，好处究竟是什么？

添加新字段

添加固定文本

在“$project”的Value字典中添加一个不存在的字段，看看效果会怎么样。例如：

db.getCollection('example_data_1').aggregate([
    {'$match': {'age': {'$gt': 28}}},
    {'$project': {'_id': 0, 'sex': 1, 'age': 1, 'hello': 'world'}}
  ])

注意这里的字段名“hello”，exampledata1数据集是没有这个字段的，而且它的值也不是“0”或者“1”，而是一个字符串。

查询结果如图7-24所示。在查询的结果中直接增加了一个新的字段。

复制现有字段。

现在把上面代码中的“world”修改为“$age”，变为：

db.getCollection('example_data_1').aggregate([
    {'$match': {'age': {'$gt': 28}}},
    {'$project': {'_id': 0, 'sex': 1, 'age': 1, 'hello': '$age'}}
  ])

查询结果如图7-25所示。

修改现有字段的数据

接下来，把原有的age的值“1”改为其他数据，代码变为：

db.getCollection('example_data_1').aggregate([
    {'$match': {'age': {'$gt': 28}}},
    {'$project': {'_id': 0, 'sex': 1, 'age': "this is age"}}
  ])

查询结果如图7-26所示。

从图7-25和图7-26可以看出，在“$project”中，如果一个字段的值不是“0”或“1”，而是一个普通的字符串，那么最后的结果就是直接输出这个普通字符串，无论数据集中原本是否有这个字段。

从图7-26可以看出，如果一个字段后面的值是“$+一个已有字段的名字”（例如“$age”），那么这个字段就会把“$”标记的字段的内容逐行复制过来。这个复制功能初看起来似乎没有什么用，原样复制能干什么？那么现在来看看exampledata2的嵌套字段。

抽取嵌套字段

对于如下图所示的数据集 example_data_2:

如果直接使用find()，想返回“user_id”和“name”，则查询语句为：

db.getCollection('example_data_2').find({}, {'user.name': 1, 'user.user_id': 1})

查询结果如图7-27所示。

返回的结果仍然是嵌套字段，这样处理起来非常不方便。而如果使用“$project”，则可以把嵌套字段中的内容“抽取”出来，变成普通字段，具体代码如下：

db.getCollection('example_data_2').aggregate([
    {'$project': {'name': '$user.name', 'user_id': '$user.user_id'}}
   ])

查询结果如图7-28所示。

普通字段处理起来显然是要比嵌套字段方便不少，这就是“复制字段”的妙用。

处理字段特殊值

看到这里，可能有读者要问：

如果想添加一个字段，但是这个字段的值就是数字“1”会怎么样？

如果添加一个字段，这个字段的值就是一个普通的字符串，但不巧正好以“$”开头，又会怎么样呢？

下面这段代码是图7-1所示的数据集的查询结果。

db.getCollection('example_data_1').aggregate([
    {'$match': {'age': {'$gt': 28}}},
    {'$project': {'_id': 0, 'id': 1, 'hello': '$normalstring', 'abcd': 1}}
  ])

查询结果如图7-29所示。

由于特殊字段的值和“$project”的自身语法冲突了，导致所有以“$”开头的普通字符串和数字都不能添加。要解决这个问题，就需要使用另一个关键字“$literal”，代码如下：

db.getCollection('example_data_1').aggregate([
    {'$match': {'age': {'$gt': 28}}},
    {'$project': {'_id': 0, 'id': 1, 'hello': {'$literal': '$normalstring'}, 'abcd': {'$literal': 1}}}
  ])

查询结果如图7-30所示。

在MongoDB中使用聚合操作筛选与修改字段

返回部分字段

添加新字段

添加固定文本

复制现有字段。

修改现有字段的数据

抽取嵌套字段

处理字段特殊值

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

在MongoDB中使用聚合操作筛选与修改字段

返回部分字段

添加新字段

添加固定文本

复制现有字段。

修改现有字段的数据

抽取嵌套字段

处理字段特殊值

热门文章

最新文章

相关课程

相关电子书

推荐镜像