从 TPCH 测试学习性能优化技巧之 Q6

一、     查询要求

Q6语句查询得到某一年中通过变换折扣带来的增量收入。这是典型的"what-if"判断,用来寻找增加收入的途径。预测收入变化查询考虑了指定的一年中折扣在"DISCOUNT-0.01""DISCOUNT0.01 "之间的已运送的所有订单,求解把l_quantity小于quantity的订单的折扣消除之后总收入增加的数量。

Q6语句的特点是:带有聚集操作的单表查询操作。查询语句使用了BETWEEN-AND操作符,有的数据库可以对BETWEEN-AND进行优化。

 

二、     Oracle执行

Oracle编写的查询SQL语句如下:

select  /*+ parallel(n) */

         sum(l_extendedprice * l_discount) as revenue

from

         lineitem

where

         l_shipdate >= date '1995-01-01'

         and l_shipdate < date '1995-01-01' + interval '1' year

         and l_discount between 0.05 - 0.01 and 0.05 + 0.01

         and l_quantity < 24;

其中/*+ parallel(n) */ Oracle的并行查询语法,n是并行数。

脚本执行时间,单位:秒

并行数

1

2

4

8

12

Oracle

328

240

183

154

135

 

三、     SPL优化

这是一个常规的过滤后聚合查询,结果集只有一条记录,没有特殊的优化技术,跟Q1一样使用多路游标充分利用并行即可。

SPL脚本如下:


A

1

=now()

2

1995-1-1

3

=elapse@y(A2,1)

4

=0.05-0.01

5

=0.05+0.01

6

>quantity=24

7

=file("lineitem.ctx").open().cursor@m(L_EXTENDEDPRICE,L_DISCOUNT;L_SHIPDATE>=A2   && L_SHIPDATE<A3 && L_DISCOUNT>=A4  && L_DISCOUNT<=A5 &&   L_QUANTITY<quantity)

8

=A7.total(sum(L_EXTENDEDPRICE*L_DISCOUNT))

9

return interval@ms(A1,now())

这里也使用了创建游标时即进行数据过滤以减少读取量的技巧(这个技巧在SPL中很常用,后面的例子中都有用到,后文中不再赘述)

 

脚本执行时间,单位:秒

并行数

1

2

4

8

12

Oracle

328

240

183

154

135

SPL组表

110

58

34

21

12

因为数据量比较大,组表的列存优势比较明显。