"SQL SELECT count (DISTINCT CustomerID) iNum,count(1) Num FROM Orders WHERE OrderDate>='2021-0 .."

Mars 开封
乾学院 6 号会员
217 浏览 • 1 年前

...

3.5 有序 COUNT DISTINCT

计算＆AI

SQL

SELECT count (DISTINCT CustomerID) iNum,count(1) Num 
FROM Orders
WHERE OrderDate>='2021-01-01' and OrderDate<='2021-12-31'

SPL

	A
1	>st=date(“2021-01-01”), et=date(“2021-12-31”), start=days@o(st), end=days@o(et)
2	=file(“Orders_Account.ctx”).open().cursor@m(CustomerID;OrderDate>=start && OrderDate <=end;2)
3	=A2.groups(;count(1):Num, icount@o(CustomerID):iNum)

A2 数据准备时使用过@p ，在这里只要简单使用@m选项就可以实现并行计算了
A3 icount@o()选项表示执行有序去重，不必在内存中保留中间缓存，只需要和上一条记录对比是否相同即可。常规的 icount() 则默认去重字段是无序的，必须在内存中保留中间缓存，当缓存超出内存容量时就会内存溢出

SQL

SELECT count(DISTINCT CustomerID),month(OrderDate) months
FROM Orders
WHERE OrderDate>='2021-01-01' and OrderDate<='2021-12-31'
GROUP BY month(OrderDate)

SPL

	A
1	>st=date(“2021-01-01”), et=date(“2021-12-31”), start=days@o(st), end=days@o(et)
2	=file(“Orders_Account.ctx”).open().cursor@m(CustomerID, OrderDate;OrderDate>=start && OrderDate <=end;2)
3	=A2.groups(month(OrderDate):months; icount@o(CustomerID):iNum)

A3 可以直接利用 groups+icount 函数计算分组后的 count distinct，不必先 group 后再计算。

以下是广告时间

对润乾产品感兴趣的小伙伴，一定要知道软件还能这样卖哟

润乾软件年买断模式

性价比还不过瘾？欢迎加入好多乾计划。
这里可以低价购买软件产品，让已经亲民的价格更加便宜！
这里可以销售产品获取佣金，赚满钱包成为土豪不再是梦！
这里还可以推荐分享抢红包，每次都是好几块钱的巨款哟！
来吧，现在就加入，拿起手机扫码，开始乾包之旅

嗯，还不太了解好多乾？

猛戳这里

玩转好多乾

SPL性能优化基础练习(38)