查询 MongoDB 子文档的 List 字段

      来源:https://groups.google.com/forum/#!msg/mongodb-user/HqzXSh5DZek/ffZG0TQ1w8cJ

【摘要】

        MongoDB 对于 List 结构中由若干字段组合而成的字符串数据有统计需求时,使用其 shell 脚本来实现有些复杂,而集算器 SPL 语言,则因拥有丰富的接口函数,实现就容易多了。若想了解更多,请前往乾学院:查询 MongoDB 子文档的 List 字段!

      在 Mongodb 应用中,经常会在 List 结构中存入由若干字段组合而成的字符串数据。这种方式对于 Mongodb 的管理比较方便,如大量导入导出数据时,不用关注数据与字段的对齐问题,导入导出数据也比较快。不过,事物的特性往往存在两方面,有利有弊,这种方式在遇到统计计算需求时,就需要将字符串进行拆分,同时转换数据类型,再进行数据计算。这时用 mongodb shell 操作就比较麻烦了,而集算器 SPL 语言拥有丰富的接口函数,实现就容易多了。现在我们通过样例来看看如何实现。

      Collction Cbettwen含有多级子文档,其中 dataList 是 List 型,含有多个字符串,每个字符串由多个数字组成。需要找出符合如下条件的字符串:第 1 个数字大于 6154 并小于等于6155。

      Cbettwen 的某个文档如下:
{
          "_id" : ObjectId("54f6a766bf4436333edcd6a2"),
          "_class" : "com.abc.core.bo.obj.Objs",
          "objList" : [
                {
                 "name" : "ABB-09",
                   "uid" : "ABB-09",
                   "data" : {
                        "dataId" : NumberLong(0),
                        "dataList" : [
                              "6150,32.9,1.475,,1.434",
                              "6150.5,43,,1.529,1.402",
                              "6151,31.8,1.506,1.447,1.453",
                              "6151.5,33.6,1.481,1.456,1.521",
                              "6152,30.9,1.465,1.472,1.547",
                              "6152.5,39.5,1.404,1.425,1.485",
                              "6153,43.2,1.406,1.446,1.481",
                              "6153.5,39.5,1.433,1.468,1.488",
                              "6154,32.7,1.459,1.477,1.427",
                              "6154.5,37.9,1.529,1.429,1.429",
                              "6155,30.4,1.505,1.532,1.543",
                              "6155.5,37.3,1.49,1.436,1.462",
                              "6156,35.3,1.538,1.45,1.488",
                              "6156.5,37.3,1.517,1.535,1.473",
                              "6157,32.7,1.401,1.405,1.497",
                              "6157.5,38.9,1.488,1.468,1.499",
                              "6158,35.4,1.526,1.422,1.452",
                              "6158.5,43.3,1.516,1.433,1.491",
                              "6159,34.6,1.519,1.442,1.478",
                              "6159.5,42.7,1.426,1.514,1.428",
                              "6160,32.7,1.451,1.5,1.516"
                              ]
                         }
                 }
         ]
 }

符合要求的字符串为:"6154.5,37.9,1.529,1.429,1.429","6155,30.4,1.505,1.532,1.543"。

集算器代码:

A
1 =mongo_open("mongodb:// localhost:27017/local?user=test&password=test")
2 =mongo_shell(A1,"Cbettwen.find(,{_id:0})")
3 =A2.conj((t=~.objList.data.dataList.new(~),t.select((s=float(#1.split@c()(1)),s>6154   && s<=6155))))
4 =A3.fetch()
5 =mongo_close(A1)

      A1:连接MongoDB,连接字格式为mongo://ip:port/db?arg=value&…

      A2:使用find函数从MongoDB中取数,形成游标。collectionCbettwen,过滤条件是空,取出_id之外的所有字段。

      A3:找到符合条件的字符串。函数conj可对A2中每个文档的计算结果进行合并,~表示上级序表的每个成员。函数new可新建序表。#1表示序表的第1个字段。函数split可将字符串拆为序列,默认分隔符是逗号,@1表示只拆成两个成员,遇到第1个分隔符就返回。s表示将首个字符串转换成float类型的数值,然后进行比较筛选。

      A4: 对游标进行批处理,获得内存数据,结果如下:

6154.5,37.9,1.529,1.429,1.429
6155,30.4,1.505,1.532,1.543
6154.6,100.9,1.529,1.429,1.429
6154.7,200.9,1.529,1.429,1.429
6155,100.3,1.49,1.436,1.462
6155,200.3,1.49,1.436,1.462
6154.6,300.9,1.529,1.429,1.429
6154.7,400.9,1.529,1.429,1.429
6155,300.3,1.49,1.436,1.462
6155,400.3,1.49,1.436,1.462
6154.6,500.9,1.529,1.429,1.429
6154.7,600.9,1.529,1.429,1.429
6155,500.3,1.49,1.436,1.462

      A5:关闭mongodb连接。

      可以看见,SPL语言的实现相对mongodb来说,更加精简容易。