"SQL SELECT count (DISTINCT CustomerID) iNum,count(1) Num FROM Orders WHERE OrderDate>='2021-0 .."

Mars 开封
乾学院 6 号会员
834 浏览 • 3 年前

3.5 有序 COUNT DISTINCT

计算＆AI

SQL

SELECT count (DISTINCT CustomerID) iNum,count(1) Num 
FROM Orders
WHERE OrderDate>='2021-01-01' and OrderDate<='2021-12-31'

SPL

	A
1	>st=date(“2021-01-01”), et=date(“2021-12-31”), start=days@o(st), end=days@o(et)
2	=file(“Orders_Account.ctx”).open().cursor@mx(CustomerID;OrderDate>=start && OrderDate <=end;2)
3	=A2.groups(;count(1):Num, icount@o(CustomerID):iNum)

A2 数据准备时使用过@p ，在这里只要简单使用@m选项就可以实现并行计算了
A3 icount@o()选项表示执行有序去重，不必在内存中保留中间缓存，只需要和上一条记录对比是否相同即可。常规的 icount() 则默认去重字段是无序的，必须在内存中保留中间缓存，当缓存超出内存容量时就会内存溢出

SQL

SELECT count(DISTINCT CustomerID),month(OrderDate) months
FROM Orders
WHERE OrderDate>='2021-01-01' and OrderDate<='2021-12-31'
GROUP BY month(OrderDate)

SPL

	A
1	>st=date(“2021-01-01”), et=date(“2021-12-31”), start=days@o(st), end=days@o(et)
2	=file(“Orders_Account.ctx”).open().cursor@mx(CustomerID, OrderDate;OrderDate>=start && OrderDate <=end;2)
3	=A2.groups(month(OrderDate):months; icount@o(CustomerID):iNum)

A3 可以直接利用 groups+icount 函数计算分组后的 count distinct，不必先 group 后再计算。

SPL性能优化基础练习(38)