MongoDB 集合间关联查询后通过$filter进行筛选

在前面的分享中,有讲解 “详解MongoDB中的多表关联查询($lookup)” 一节,其内容涵盖了常见的集合管理的需求。我们知道文档的选择都是通过$match进行匹配刷选。但这是文档间的匹配筛选,并没有对单个新生成的文档进行内嵌子文档进行筛选。

那么什么是$lookup后新文档的内嵌子文档呢?

假设有以下2个集合,一个是商品库存集合 inventory,存储的测试数据 如下:

db.inventory.insert([
   { "_id" : 1, "sku" : "almonds", product: "product 1", "instock" : 120 },
   { "_id" : 2, "sku" : "bread1",  product: "product 2", "instock" : 80 },
   { "_id" : 3, "sku" : "bread2",  product: "product 2", "instock" : 80 },
   { "_id" : 4, "sku" : "pecans1", product: "product 4", "instock" : 70 },
   { "_id" : 5, "sku" : "pecans2", product: "product 4", "instock" : 70 },
])

一个是商品对应的原料集合product,存储的测试数据,如下。 

db.product.insert([
   { "_id" : 1, product: "product 1", description: "金玉满堂1" },
   { "_id" : 2,  product: "product 2", description: "招财进宝"},
   { "_id" : 3, product: "product 4", description: "杨柳依依"},
])

两个集合都包含有product 字段,如果 需求是按原料名称统计每个原料对应的商品情况。

可以根据字段product进行集合关联,并且product集合的文档与inventory 集合的文档是 一对多 的关系。

执行关联脚本查询的脚本如下:

db.product.aggregate([
   {
     $lookup:
       {
         from: "inventory",
         localField: "product",
         foreignField: "product",
         as: "inventory_docs"
       }
  }
])

新生成的聚合集合的文档如下:

/* 1 */
{
    "_id" : 1,
    "product" : "product 1",
    "description" : "金玉满堂1",
    "inventory_docs" : [
        {
            "_id" : 1,
            "sku" : "almonds",
            "product" : "product 1",
            "instock" : 120,
            "state" : "OK"
        }
    ]
},

/* 2 */
{
    "_id" : 2,
    "product" : "product 2",
    "description" : "招财进宝",
    "inventory_docs" : [
        {
            "_id" : 2,
            "sku" : "bread1",
            "product" : "product 2",
            "instock" : 80,
            "state" : "OK"
        },
        {
            "_id" : 3,
            "sku" : "bread2",
            "product" : "product 2",
            "instock" : 80,
            "state" : "Simple"
        }
    ]
},

/* 3 */
{
    "_id" : 3,
    "product" : "product 4",
    "description" : "杨柳依依",
    "inventory_docs" : [
        {
            "_id" : 4,
            "sku" : "pecans1",
            "product" : "product 4",
            "instock" : 70,
            "state" : "OK"
        },
        {
            "_id" : 5,
            "sku" : "pecans2",
            "product" : "product 4",
            "instock" : 70,
            "state" : "Simple"
        }
    ]
}

从返回结果可以看出,

(1) 返回的文档数量和.aggreate的集合文档数量一样(即外面的那个集合,而不是新字段的From的那个集合)。

(2)关联的主要功能是将每个输入待处理的文档,经过$lookup 阶段的处理,输出的新文档中会包含一个新生成的数组列(户名可根据需要命名新key的名字 )。数组列存放的数据 是 来自 被Join 集合的适配文档,如果没有,集合为空(即 为[ ])。

注意新的字段的类型是数组的形式,一对多的时候,新字段就是就是明显的内嵌子文档。

我们看到新文档的字段 inventory_docs ,它由两个 内嵌 子文档组成,

"inventory_docs" : [
        {
            "_id" : 4,
            "sku" : "pecans1",
            "product" : "product 4",
            "instock" : 70,
            "state" : "OK"
        },
        {
            "_id" : 5,
            "sku" : "pecans2",
            "product" : "product 4",
            "instock" : 70,
            "state" : "Simple"
        }
    ]

 

那么如何根据要求筛选符合要求的子文档呢?$match是不可以的,这时候可以通过$filter。

代码如下:

db.product.aggregate([
   {
     $lookup:
       {
         from: "inventory",
         localField: "product",
         foreignField: "product",
         as: "inventory_docs"
       }
  }
  ,
       {
      $project: {
         inventory_docs: {
            $filter: {
               input: "$inventory_docs",
               as: "item",
              cond: { $eq: [ "$$item.state", "OK" ] }
            }
         }
      }
       }
])

结果显示如下:

/* 1 */
{
    "_id" : 1,
    "inventory_docs" : [
        {
            "_id" : 1,
            "sku" : "almonds",
            "product" : "product 1",
            "instock" : 120,
            "state" : "OK"
        }
    ]
},

/* 2 */
{
    "_id" : 2,
    "inventory_docs" : [
        {
            "_id" : 2,
            "sku" : "bread1",
            "product" : "product 2",
            "instock" : 80,
            "state" : "OK"
        }
    ]
},

/* 3 */
{
    "_id" : 3,
    "inventory_docs" : [
        {
            "_id" : 4,
            "sku" : "pecans1",
            "product" : "product 4",
            "instock" : 70,
            "state" : "OK"
        }
    ]
}

从结果可以看出,数组子文档 没有了state:"Simple"的数据(子文档)。

 

本文版权归作者所有,未经作者同意不得转载,谢谢配合!!!

上一篇:MySQL中 delete from 时提示 1064 错误。


下一篇:java 如何获取京东商品实时价格