计算每组的前 N 名
【问题】
需求:
表 1 是股票发生大宗交易的股票代码、日期、大宗交易成交价格
表 2 是各个股票的历史记录
现在希望能够得到每个发生大宗交易的股票在这一天之后 3 天 (包括发生当天) 之内的价格记录
表 1 如下:
Code Date1 Price1
1 2014/3/12 5
2 2014/3/13 2
3 2014/3/13 3
表 2 如下:
Code Date2 Price2
1 2014/3/10 4
1 2014/3/11 4.09
1 2014/3/12 4.01
1 2014/3/13 4.05
1 2014/3/14 4.10
1 2014/3/15 4.50
1 2014/3/16 4.45
2 2014/3/10 4
2 2014/3/11 4.09
2 2014/3/12 4.01
2 2014/3/13 4.05
2 2014/3/14 4.10
2 2014/3/15 4.50
2 2014/3/16 4.45
3 2014/3/10 4
3 2014/3/11 4.09
3 2014/3/12 4.01
3 2014/3/13 4.05
3 2014/3/14 4.10
3 2014/3/15 4.50
3 2014/3/16 4.45
3 2014/3/17 4.50
得到的目标结果应该是:
Code Date1 Price1 Date2 Price2
1 2014/3/12 5 2014/3/12 4.01
1 2014/3/12 5 2014/3/13 4.05
1 2014/3/12 5 2014/3/14 4.10
2 2014/3/13 2 2014/3/13 4.05
2 2014/3/13 2 2014/3/14 4.10
2 2014/3/13 2 2014/3/15 4.50
3 2014/3/13 3 2014/3/13 4.05
3 2014/3/13 3 2014/3/14 4.10
3 2014/3/13 3 2014/3/15 4.50
最基本的连接我会写,但是要怎么限定在大宗交易发生之后 3 个交易日的记录不知道要怎么去限定。而且,因为交易存在双休日,是不能通过限定日期的,必须通过判断记录数才行。
求大神指导,跪谢!
【回答】
自然的思路是:关联两表后按 Code、Date1 和 Date2 排序,再按 Code 和 Date1 分组,取每组中 Date2 大于等于 Date1 的三条记录即可完成。但由于 SQL 分组后无法保存分组结果,而且 SQL 集合无序很难取出连续的三条记录。对于支持窗口函数的数据库实现要简单些:
select *
from ( select ROW_NUMBER() OVER( PARTITION by t1.code,t1.date1 ORDER BY t2.date2) rn,
t1.code,
t1.date1,
t1.price1,
t2.date2,
t2.price2
from t1
join t2 on t1.code = t2.code
where t2.date2 >= t1.date1) t
where rn <= 3
这类有序计算使用 SPL 会更方便,有集合数据和按位置操作的功能,代码通用直观,也能适用于没有窗口函数的数据库:
A |
|
1 |
$(db1)select t1.code Code, t1.date1 Date1, t1.price1 Price1, t2.date2 Date2, t2.price2 Price2 from t0070_1 t1 join t0070_2 t2 on t1.code = t2.code where t2.date2 >= t1.date1 order by t1.code,t1.date1,t2.date2 |
2 |
=A1.group(Code,Date1).(~.m([1,2,3]).select(~)).conj() |
关于更多 SPL 集合的使用,参考《SPL 中集合的使用》。