从 TPCH 测试学习性能优化技巧之 Q6
一、 查询要求
Q6语句查询得到某一年中通过变换折扣带来的增量收入。这是典型的"what-if"判断,用来寻找增加收入的途径。预测收入变化查询考虑了指定的一年中折扣在"DISCOUNT-0.01"和"DISCOUNT+0.01 "之间的已运送的所有订单,求解把l_quantity小于quantity的订单的折扣消除之后总收入增加的数量。
Q6语句的特点是:带有聚集操作的单表查询操作。查询语句使用了BETWEEN-AND操作符,有的数据库可以对BETWEEN-AND进行优化。
二、 Oracle执行
Oracle编写的查询SQL语句如下:
select /*+ parallel(n) */
sum(l_extendedprice * l_discount) as revenue
from
lineitem
where
l_shipdate >= date '1995-01-01'
and l_shipdate < date '1995-01-01' + interval '1' year
and l_discount between 0.05 - 0.01 and 0.05 + 0.01
and l_quantity < 24;
其中/*+ parallel(n) */ 是Oracle的并行查询语法,n是并行数。
脚本执行时间,单位:秒
并行数 |
1 |
2 |
4 |
8 |
12 |
Oracle |
328 |
240 |
183 |
154 |
135 |
三、 SPL优化
这是一个常规的过滤后聚合查询,结果集只有一条记录,没有特殊的优化技术,跟Q1一样使用多路游标充分利用并行即可。
SPL脚本如下:
A |
|
1 |
=now() |
2 |
1995-1-1 |
3 |
=elapse@y(A2,1) |
4 |
=0.05-0.01 |
5 |
=0.05+0.01 |
6 |
>quantity=24 |
7 |
=file("lineitem.ctx").open().cursor@m(L_EXTENDEDPRICE,L_DISCOUNT;L_SHIPDATE>=A2 && L_SHIPDATE<A3 && L_DISCOUNT>=A4 && L_DISCOUNT<=A5 && L_QUANTITY<quantity) |
8 |
=A7.total(sum(L_EXTENDEDPRICE*L_DISCOUNT)) |
9 |
return interval@ms(A1,now()) |
这里也使用了创建游标时即进行数据过滤以减少读取量的技巧(这个技巧在SPL中很常用,后面的例子中都有用到,后文中不再赘述)。
脚本执行时间,单位:秒
并行数 |
1 |
2 |
4 |
8 |
12 |
Oracle |
328 |
240 |
183 |
154 |
135 |
SPL组表 |
110 |
58 |
34 |
21 |
12 |
因为数据量比较大,组表的列存优势比较明显。
英文版