"一、查询要求 Q11 语句通过扫描某给定国供应商的库存，找到在所有零件总价值中占重要百分比的各个零件，查询结果显示零件编号和价值，并按价值降 .."

sjr 北京
乾学院 32 号会员
1 回帖 • 1,330 浏览 • 6 年前

从 TPCH 测试学习性能优化技巧之 Q11

计算＆AI

集算器(536)

一、查询要求

Q11 语句通过扫描某给定国供应商的库存，找到在所有零件总价值中占重要百分比的各个零件，查询结果显示零件编号和价值，并按价值降序排列。

Q11语句的特点是：带有分组、排序、聚集、子查询操作并存的多表连接查询操作。子查询位于分组操作的HAVING条件中。

二、 Oracle执行

Oracle编写的查询SQL语句如下：

select /*+ parallel(n) */

ps_partkey,

sum(ps_supplycost * ps_availqty) as value

from

partsupp,

supplier,

nation

where

ps_suppkey = s_suppkey

and s_nationkey = n_nationkey

and n_name = 'CHINA'

group by

ps_partkey

having

sum(ps_supplycost * ps_availqty) > (

select

sum(ps_supplycost * ps_availqty) * 0.000001

from

partsupp,

supplier,

nation

where

ps_suppkey = s_suppkey

and s_nationkey = n_nationkey

and n_name = 'CHINA'

)

order by

value desc;

其中/*+ parallel(n) */ 是Oracle的并行查询语法，n是并行数。

脚本执行时间，单位：秒

并行数	1	2	4	8	12
Oracle	71	52	43	36	33

三、 SPL优化

我们把下面的子查询看成为视图V：

select

ps_partkey,

sum(ps_supplycost * ps_availqty) as value

from

partsupp,

supplier,

nation

where

ps_suppkey = s_suppkey

and s_nationkey = n_nationkey

and n_name = 'CHINA'

则原主体查询等价于

select

ps_partkey,

value

from V

where value>0.000001*(select sum(value) from V)

这个V已经是经过分组后的结果集，数量较小，遍历V比直接针对partsupp遍历的计算量要小很多。

而我们还知道，partsupp表是按主键ps_partkey,ps_suppkey有序的，也就是对ps_partkey有序，这时候针对该字段的分组可以使用有序分组方案，以提高计算V的性能。

SPL脚本如下：

	A
1	=now()
2	>name="CHINA"
3	>percent=0.000001
4	=file("nation.btx").import@b().select(N_NAME== name).derive@o().keys@i(N_NATIONKEY)
5	=file("supplier.ctx").open().cursor@m(S_SUPPKEY;A4.find(S_NATIONKEY)).fetch().keys@i(S_SUPPKEY)
6	=file("partsupp.ctx").open().cursor@m(PS_PARTKEY,PS_AVAILQTY,PS_SUPPLYCOST;A5.find(PS_SUPPKEY))
7	=A6.groups@o(PS_PARTKEY;sum(PS_SUPPLYCOST*PS_AVAILQTY):value)
8	=A7.sum(value)*percent
9	=A7.select(value>A8).sort@z(value)
10	return interval@ms(A1,now())

A7用groups@o执行有序分组，相当于计算出视图V，然后A8,A9对A7进行两次遍历计算出结果。

脚本执行时间，单位：秒

并行数	1	2	4	8	12
Oracle	71	52	43	36	33
SPL组表	24	15	9	6	5

集算器(536)

从 TPCH 测试学习性能优化技巧之 Q11

一、 查询要求

二、 Oracle执行

三、 SPL优化

目录

一、查询要求