*SQL, 将相近发生的事件分为一组后编号
Big query 数据库的表记录了用户的多次事件,比如某用户按时间排序后如下:
date |
user |
2024-04-08 |
bob |
2024-04-11 |
bob |
2024-04-12 |
bob |
2024-04-17 |
bob |
2024-04-18 |
bob |
2024-04-25 |
bob |
现在要新增计算列 session_id:以第一次事件为标志,session_id 为 1;如果新事件距离标志在 7 天内,则 session_id 不变;如果新事件距离标志大于 7 天,则 session_id 递增,重置标志为该事件。
date |
user |
session_id |
2024-04-08 |
bob |
1 |
2024-04-11 |
bob |
1 |
2024-04-12 |
bob |
1 |
2024-04-17 |
bob |
2 |
2024-04-18 |
bob |
2 |
2024-04-25 |
bob |
3 |
编写SPL代码
A |
|
1 |
=BigQryJDBC.query("select * from tb order by date where user=?","Bob") |
2 |
>d=A1.date,s=1 |
3 |
=A1.derive(s+=if(date-d>7,(d=date,1)):session_id) |
A1:通过JDBC查询某用户的事件记录。
A2:设置变量,d是标志日期,初值为第一次事件的日期;s是session_id 的变量,初值为 1。
A3:按规则新增计算列session_id。当当前记录的日期和标志日期差距大于7天时,将标志日期重置为当前记录的日期,并将s加1。。
问题来源:https://stackoverflow.com/questions/78393653/sql-date-window-reset-after
英文版 https://c.scudata.com/article/1732265922149
👍 👍
跟着练一下…derive 创建新列的时候可以引用该新列