MongoDB 如何实现嵌套子文档分组

 

关键字:嵌套 多层嵌套 子文档 聚集运算 分组

      MongoDB 嵌套结构的数据非常常见, 它通过嵌套子文档,达到一对多的关联关系。但嵌套结构中按分类分组求子文档的数据计算,不能直接通过 $group 聚集运算来实现,需要将嵌套结构解开,由多层嵌套结构变成多条单层结构来计算,由于中间过程的处理,且还要借且其它函数辅助实现输出。下面以集合 order 为例说明,按 category 分组获取 term 的数量并按由大到小的顺序输出。

[
 { category: "movies",
   terms: [{ term: "movie 1", total: 1000}, {term: "movie 2", total: 100}  ]
 },
 { category: "sports",
   terms: [{ term: "football 1", total: 1000}, {term: "tennis 2", total: 120}  ]
 },
 { category: "movies",
   terms: [{ term: "movie 1", total: 5000}, {term: "movie 2", total: 200},
 {term: "movie 3", total: 280}  ]
 },
 { category: "sports",
   terms: [{ term: "football 1", total: 4000}, {term: "tennis 2", total: 250},
{term: "tennis 2", total: 450}  ]
 },

]

MongoDB通过聚集运算 aggregate,group 实现如下:
    db.order.aggregate([
   {$unwind : "$terms"},
   { $group : { _id : {
            category: "$category",
            term: "$terms.term" },
            total: {$sum : "$terms.total"}
            }
   },
   {$sort : { total : -1} },
   { $project: {
            _id: 0,
            category: "$_id.category",
            term: "$_id.term",
            total:1}}
])

      $unwind将 terms数组拆分成多条, 再由 $group 分组、求和、排序后,最后用 $project过滤字段输出。

      如果有集算器协助 MongoDB,就不需要这么繁琐的组合运算:

A
1 =mongo_open("mongodb://127.0.0.1:27017/raqdb")
2 =mongo_shell(A1,"order.find()").fetch()
3 =A2.conj(terms.derive(A2.category))
4 =A5.group(category,term;~.sum(total):total).sort(-total)
5 >A1.close()
      集算器 SPL 不仅对解决嵌套分组,对 MongoDB 很多困难的计算都有帮助,可以参考《 辅助 MongoDB 计算》。
      SPL 也能很方便地嵌入到 JAVA 应用,可参考 《Java 如何调用 SPL 脚本》

      具体使用方法可参考《如何使用集算器》