将相近发生的事件分为一组后编号

Big query 数据库的表记录了用户的多次事件,比如某用户按时间排序后如下:

date

user

2024-04-08

bob

2024-04-11

bob

2024-04-12

bob

2024-04-17

bob

2024-04-18

bob

2024-04-25

bob

现在要新增计算列 session_id:以第一次事件为标志,session_id 为 1;如果新事件距离标志在 7 天内,则 session_id 不变;如果新事件距离标志大于 7 天,则 session_id 递增,重置标志为该事件。

date

user

session_id

2024-04-08

bob

1

2024-04-11

bob

1

2024-04-12

bob

1

2024-04-17

bob

2

2024-04-18

bob

2

2024-04-25

bob

3

编写SPL代码


 A

1

=BigQryJDBC.query("select * from tb order by date where user=?","Bob")

2

>d=A1.date,s=1

3

=A1.derive(s+=if(date-d>7,(d=date,1)):session_id)

A1:通过JDBC查询某用户的事件记录。

A2:设置变量,d是标志日期,初值为第一次事件的日期;ssession_id 的变量,初值为 1

A3:按规则新增计算列session_id。当当前记录的日期和标志日期差距大于7天时,将标志日期重置为当前记录的日期,并将s1。。

问题来源:https://stackoverflow.com/questions/78393653/sql-date-window-reset-after