从 TPCH 测试学习性能优化技巧之 Q10

一、     查询要求

Q10语句是查询每个国家在某时刻起的三个月内货运存在问题的客户和造成的损失。

Q10语句的特点是:带有分组、排序、聚集操作并存的多表连接查询操作。查询语句没有从语法上限制返回多少条元组,但是TPC-H标准规定,查询结果只返回前20行(通常依赖于应用程序实现)。

 

二、     Oracle执行

Oracle编写的查询SQL语句如下:

select * from (

         select  /*+ parallel(n) */

                   c_custkey,c_name,

                   sum(l_extendedprice * (1 - l_discount)) as revenue,

                   c_acctbal,n_name,c_address,c_phone,c_comment

         from

                   customer,orders,lineitem,nation

         where

                   c_custkey = o_custkey

                   and l_orderkey = o_orderkey

                   and o_orderdate >= date '1993-05-01'

                   and o_orderdate < date '1993-05-01' + interval '3' month

                   and l_returnflag = 'R'

                   and c_nationkey = n_nationkey

         group by

                   c_custkey,

                   c_name,

                   c_acctbal,

                   c_phone,

                   n_name,

                   c_address,

                   c_comment

         order by

                   revenue desc

) where rownum <=20;

其中/*+ parallel(n) */ Oracle的并行查询语法,n是并行数。

脚本执行时间,单位:秒

并行数

1

2

4

8

12

Oracle

591

399

313

237

215

 

三、     SPL优化

这里的orderslineitem主子表关联优化原理与Q3中类似。

 

SPL脚本如下:


A

1

=now()

2

1993-5-1

3

=elapse@m(A2,3)

4

=file("orders.ctx").open().cursor@m(O_ORDERKEY,O_CUSTKEY,O_ORDERDATE;O_ORDERDATE>=A2   && O_ORDERDATE<A3)

5

=file("lineitem.ctx").open().news(A4,L_ORDERKEY,L_EXTENDEDPRICE,L_DISCOUNT,L_RETURNFLAG,O_CUSTKEY,O_ORDERDATE;L_RETURNFLAG=="R")

6

=A5.groups@u(O_CUSTKEY:c_custkey;sum(L_EXTENDEDPRICE*(1-L_DISCOUNT)):revenue)

7

=A6.top(-20;revenue)

8

=file("nation.btx").import@b().keys@i(N_NATIONKEY)

9

=file("customer.ctx").open()

10

=A7.joinx@q(c_custkey,A9:C_CUSTKEY,C_NAME,C_ADDRESS,C_NATIONKEY,C_PHONE,C_ACCTBAL,C_COMMENT).fetch()

11

=A10.switch(C_NATIONKEY,A8:N_NATIONKEY)

12

=A11.new(c_custkey:C_CUSTKEY,C_NAME,revenue,C_ACCTBAL,C_NATIONKEY.N_NAME,C_ADDRESS,C_PHONE,C_COMMENT)

13

=A12.sort@z(revenue)

14

return interval@ms(A1,now())

先把orderslineitem表的连接结果集上的分组汇总运算做完,然后再基于这个结果集继续做外部相关的外键表关联运算。因为最终结果只要取20条记录,可以只针对这20条记录再做剩下的关联计算,所以不必在分组前做,否则计算量会增大。

A7算出来之后,因为customer表对c_custkey有序,用A7.joinx@qcustomer表中有序匹配快速地把相关记录取出来,再去做其它join,无须遍历customer表,减少数据读取量。

 

脚本执行时间,单位:秒

并行数

1

2

4

8

12

Oracle

591

399

313

237

215

SPL组表

108

61

36

23

21

 

 


以下是广告时间

对润乾产品感兴趣的小伙伴,一定要知道软件还能这样卖哟性价比还不过瘾? 欢迎加入好多乾计划。
这里可以低价购买软件产品,让已经亲民的价格更加便宜!
这里可以销售产品获取佣金,赚满钱包成为土豪不再是梦!
这里还可以推荐分享抢红包,每次都是好几块钱的巨款哟!
来吧,现在就加入,拿起手机扫码,开始乾包之旅



嗯,还不太了解好多乾?
猛戳这里
玩转好多乾