有序分段聚合
有序分段聚合
【问题】
有这样一组数据 a,b 两字段
a | b |
---|---|
10 | 3 |
21 | 4 |
33 | 6 |
46 | 7 |
52 | 10 |
现在想得到这样的结果
a<10 | sum(b) |
a<20 | sum(b) |
a<30 | sum(b) |
a<40 | sum(b) |
a<50 | sum(b) |
a 字段的值可以分多到 1000 多段
【回答】
按指定条件分段聚合,在 SQL 中可以这样做:
with
cr as
(
select “a<10” x, b b from test3 where a < 10 union all
select “a<20” x, b b from test3 where a < 20 union all
select “a<30” x, b b from test3 where a < 30 union all
select “a<40” x, b b from test3 where a < 40 union all
select “a<50” x, b b from test3 where a < 50
)
select x,sum(b) from cr group by x;
结果:
这样分段太多就很麻烦。
SPL 可以用动态对数字字段分段生成条件序列,根据每个分段条件聚合生成结果序表,这样分段再多也可以用简单的几行语句解决:
A | |
---|---|
1 | =connect("db") |
2 | =A1.query("select a,b from test3 order by a") |
3 | =(A2.m(-1).a – 1)\10+1 |
4 | =A3.new(~*10:C,A2.select(a<C).sum(b):D) |
A1:连接 db 数据库。
A2:查询源表,按照 a 来排序。
A3:找到分段的最后一个段号。A2.m 函数是找到 A2 序表中的某个结果,参数是序号,负数代表倒数值。这里找到最后一条结果的 a 字段的值,并用他算出最大的 a 值所在的区间。最后一个值 52 对应的区间是 51-60,(A2.m(-1).a – 1)\10+1 计算出来是 6。
A4:new 函数计算 A3 排列字段值生成新序表。每一个参数对应一个新的列,冒号后面是新列的列名。A3 是数字值 6 时,A3.new() 代表循环 6 次执行 new,可以用 ~ 代表每次的序号。C 列是序号乘 10,D 列是根据 A2 按 a<C 条件查询的结果对 b 进行的求和的结果。
A2
A3
A4