计算 mongodb 之数组查下标

**【摘要】**
      数据库 Mongodb 不能通过元素值来查询下标,在数组中实现排名次序,但可以利用集算器 SPL 语言来进行辅助实现。若想了解更多,请前往乾学院:计算 mongodb 之数组查下标!

      排名在各行各业都比较流行,大到世界大学排名、福布斯富豪榜,小到班级学生成绩排名、银行按号排队办理业务等等。在数字化时代,通常数据库都能比较方便地支持排名次序。不过,也并不是所有的数据库都能如此,例如数据库 Mongodb,它可以按照下标查出内嵌数组的元素,但是却不能通过元素值来查询下标,也就是不能知道元素的次序。如果在 MongoDB 数组中按照排名先后顺序存放人员姓名,它可以做到根据排名(数组下标)来找姓名,但是不能通过姓名查找排名(数组下标),也就是能够知道排第几名的是谁,却不能知道某人排在第几个位置。对于这种情况,我们可以利用集算器 SPL 语言来进行辅助,完美实现数组查下标的功能,下面用例子说明。

       Mongodb 的集合 users 中,保存了姓名和朋友(数组)。朋友数组中的人名是按照排名顺序保存的,样例数据如下:
> db.users.find({"name":"jim"})
{
"_id" : ObjectId("544f3bf8cdb02668db9ab229"), "name" : "jim", "friends" : ["tom", "jack", "luke", "rose", "james", "sam", "peter"]

}

    mongodb查找指定排名的人名,例如查找 jim 的朋友当中,排名第一的人名:
> db. users.find({"name":"jim"},{"friends":{"$slice":[0,1]}})
{
"_id" : ObjectId("544f3bf8cdb02668db9ab229"), "name" : "jim", "friends" : ["tom"]
}
       如果只用 MongoDB 的功能,我们无法查找 jim 的朋友当中“luke”的排名数值,不过使用了 SPL 语言后就可以轻松实现了。
      使用集算器 SPL 的代码如下:

A
1 =mongo_open("mongodb://localhost:27017/local?user=test&password=test")
2 =mongo_shell(A1,"users.find({name:'jim'},{name:1,friends:1,_id:0})")
3 =A2.fetch()
4 =A3.friends.pos("luke")
5 =mongo_close(A1)

       A1:连接 mongodb,ip 和端口号是 localhost:27017,数据库是local,用户名和密码都是 test。如果需要其他参数的话可以按照 mongo://ip:port/db?arg=value&…格式设置参数。
       A2:使用 MongoDB 的 find 函数从集合 users 中取数,形成游标。过滤条件是 name=jim,指定键是 name 和 friends。SPL游标能够分批读取和处理数据,可以避免数据量过大,以防内存溢出。
      A3:因为数据量不大,所以这里可以直接 fetch 出游标的所有记录。
      A4:使用 pos 函数,查出 luke 的位置。
      运行的结果是:

Value
3

       简言之,SPL 先通过条件获取到排名的数据,再用函数 pos() 查出所给人员姓名的位置,使用非常容易,书写也简洁。

      需要说明的是:集算器SPL并不包含mongodbjava驱动包。如果要用SPL访问mongodb,必须提前将mongodbjava驱动包(例如:mongo-java-driver-3.9.1.jar)放到集算器设置的外部库目录extLib\MongoCli下。

      除了在集算器中直接计算,上述使用SPL语言协助mongodb计算的脚本也很容易集成到java中,只要增加一行,写成return A4即可向java输出resultset形式的结果,具体的代码参考SPL教程。同样,用java调用SPL访问mongodb也必须将mongdbjava驱动包放到java程序的classpath中。