有序分段聚合

有序分段聚合

【问题】

有这样一组数据 a,b 两字段

a b
10 3
21 4
33 6
46 7
52 10

现在想得到这样的结果

a<10 sum(b)
a<20 sum(b)
a<30 sum(b)
a<40 sum(b)
a<50 sum(b)

a 字段的值可以分多到 1000 多段

【回答】

按指定条件分段聚合,在 SQL 中可以这样做:

with

cr as

(

select “a<10” x, b b from test3 where a < 10 union all

select “a<20” x, b b from test3 where a < 20 union all

select “a<30” x, b b from test3 where a < 30 union all

select “a<40” x, b b from test3 where a < 40 union all

select “a<50” x, b b from test3 where a < 50

)

select x,sum(b) from cr group by x;

结果:

imagepng

这样分段太多就很麻烦。

SPL 可以用动态对数字字段分段生成条件序列,根据每个分段条件聚合生成结果序表,这样分段再多也可以用简单的几行语句解决:

A
1 =connect("db")
2 =A1.query("select a,b from test3 order by a")
3 =(A2.m(-1).a – 1)\10+1
4 =A3.new(~*10:C,A2.select(a<C).sum(b):D)

A1:连接 db 数据库。

A2:查询源表,按照 a 来排序。

A3:找到分段的最后一个段号。A2.m 函数是找到 A2 序表中的某个结果,参数是序号,负数代表倒数值。这里找到最后一条结果的 a 字段的值,并用他算出最大的 a 值所在的区间。最后一个值 52 对应的区间是 51-60,(A2.m(-1).a – 1)\10+1 计算出来是 6。

A4:new 函数计算 A3 排列字段值生成新序表。每一个参数对应一个新的列,冒号后面是新列的列名。A3 是数字值 6 时,A3.new() 代表循环 6 次执行 new,可以用 ~ 代表每次的序号。C 列是序号乘 10,D 列是根据 A2 按 a<C 条件查询的结果对 b 进行的求和的结果。

A2

imagepng

A3

imagepng

A4

imagepng