从 TPCH 测试学习性能优化技巧之 Q6

一、     查询要求

Q6语句查询得到某一年中通过变换折扣带来的增量收入。这是典型的"what-if"判断,用来寻找增加收入的途径。预测收入变化查询考虑了指定的一年中折扣在"DISCOUNT-0.01""DISCOUNT0.01 "之间的已运送的所有订单,求解把l_quantity小于quantity的订单的折扣消除之后总收入增加的数量。

Q6语句的特点是:带有聚集操作的单表查询操作。查询语句使用了BETWEEN-AND操作符,有的数据库可以对BETWEEN-AND进行优化。

 

二、     Oracle执行

Oracle编写的查询SQL语句如下:

select  /*+ parallel(n) */

         sum(l_extendedprice * l_discount) as revenue

from

         lineitem

where

         l_shipdate >= date '1995-01-01'

         and l_shipdate < date '1995-01-01' + interval '1' year

         and l_discount between 0.05 - 0.01 and 0.05 + 0.01

         and l_quantity < 24;

其中/*+ parallel(n) */ Oracle的并行查询语法,n是并行数。

脚本执行时间,单位:秒

并行数

1

2

4

8

12

Oracle

328

240

183

154

135

 

三、     SPL优化

这是一个常规的过滤后聚合查询,结果集只有一条记录,没有特殊的优化技术,跟Q1一样使用多路游标充分利用并行即可。

SPL脚本如下:


A

1

=1

2

=now()

3

>date=date("1995-01-01")

4

>discount=0.05

5

>quantity=24

6

=elapse@y(date,1)

7

=file(path+"lineitem.ctx").create().cursor@m(L_EXTENDEDPRICE,L_DISCOUNT;L_SHIPDATE>=date   && L_SHIPDATE < A6 && L_DISCOUNT >= discount - 0.01   && L_DISCOUNT <= discount + 0.01 && L_QUANTITY <   quantity;A1)

8

=A7.groups(;sum(L_EXTENDEDPRICE*L_DISCOUNT):revenue)

9

=now()

10

=interval@s(A2,A9)

这里也使用了创建游标时即进行数据过滤以减少读取量的技巧(这个技巧在SPL中很常用,后面的例子中都有用到,后文中不再赘述)

 

脚本执行时间,单位:秒

并行数

1

2

4

8

12

Oracle

328

240

183

154

135

SPL组表

110

58

34

21

12

因为数据量比较大,组表的列存优势比较明显。