计算&AI •
874 引用 •
936 回帖 •
446 关注
博客
关注
-
一、 SQL 及分析 查询SQL语句如下: select 100.00 * sum( case when p_type like 'PROMO%' then l_extendedprice * ..
-
一、 SQL 及分析 查询SQL语句如下: select c_count, count(*) as custdist from ( select c_custkey, count(o_orde ..
-
一、 SQL 及分析 查询SQL语句如下: select l_shipmode, sum(case when o_orderpriority = '1-URGENT' or o_orderpr ..
-
一、 SQL 及分析 查询SQL语句如下: select ps_partkey, sum(ps_supplycost * ps_availqty) as value from partsupp ..
-
一、 SQL 及分析 查询SQL语句如下: select * from ( select c_custkey,c_name, sum(l_extendedprice * (1 - l_disc ..
-
一、 SQL 及分析 查询SQL语句如下: select nation, o_year, sum(amount) as sum_profit from ( select n_name as n ..
-
一、 SQL 及分析 查询SQL语句如下: select sum(l_extendedprice * l_discount) as revenue from lineitem where l_ ..
-
一、 SQL 及分析 查询SQL语句如下: select o_year, sum(case when nation = 'CHINA' then volume else 0 end) / su ..
-
一、 SQL 及分析 查询SQL语句如下: select supp_nation, cust_nation, l_year, sum(volume) as revenue from ( sel ..
-
一、 SQL 及分析 查询SQL语句如下: select n_name, sum(l_extendedprice * (1 - l_discount)) as revenue from cus ..
-
一、 SQL 及分析 查询SQL语句如下: select o_orderpriority, count(*) as order_count from orders where o_orderd ..
-
一、 SQL 及分析 查询SQL语句如下: select * from ( select l_orderkey, sum(l_extendedprice * (1 - l_discount)) ..
-
一、 SQL 及分析 查询SQL语句如下: select * from ( select s_acctbal,s_name,n_name,p_partkey,p_mfgr,s_address, ..
-
一、 SQL 及分析 查询SQL语句如下: select l_returnflag, l_linestatus, sum(l_quantity) as sum_qty, sum(l_exten ..
-
一、 数据准备 利用TPCH官方工具生成文本文件形式的原始数据,共8个表,数据量总规模100G,各文件大小见后表。 然后根据这些文本文件生成SPL的二进制文件,每个表对应一个二进制文件。 组表 ..
-
SQL 和 SPL 都是面向结构化数据的通用处理技术。SQL 普及率高受众广,很多用户天生就会用 SQL 查询数据,如果数据引擎支持 SQL 就会很容易上手,而且历史程序也相对容易迁移;SPL ..
-
SQL WITH m AS( SELECT *, row_number() OVER(PARTITION BY year(OrderDate),month(OrderDate)) r FROM ..
-
很多大机构都会有个中央数据仓库负责向应用提供数据服务。随着业务的发展,中央数据仓库的负载在持续增加。一方面,数仓是前端应用的数据后台,而前端应用不断增多,用户访问的并发数也不断增长。另一方面, ..
-
【摘要】 本文分析大文件计算的实现原理,如过滤、聚合计算、添加计算列、排序、分组聚合、topN 等,以及利用并行计算来提高计算速度,并用 esProc SPL 举例说明如何用简洁的脚本实现大文 ..
-
关系数据库提供了 SQL,因而有较强的计算能力,但很遗憾的是,这个计算能力是封闭的。所谓计算封闭性,是指要被数据库计算和处理的数据,必须事先装入数据库之内,数据在数据库内部还是外部是很明确的。 ..
-
宽表在 BI 业务中比比皆是,每次建设 BI 系统时首先要做的就是准备宽表。有时系统中的宽表可能会有上千个字段,经常因为“过宽”超过了数据库表字段数量限制还要再拆分。 为什么大家乐此不疲地造宽 ..
-
使用分布式集群来处理大数据是当前的主流,将一个大任务拆分成多个子任务分布到多个节点进行处理通常能获得显著的性能提升。因此,只要发现处理能力不足就可以通过增加节点的方式进行扩容,这也是很多拥趸者 ..
-
SQL SELECT floor((year(curdate())-year(Employees.Birthday))/10) Age, sum(Orders.Amount) Amount F ..
-
用 SPL 实现高性能计算,通常要将数据转存成 SPL 的格式。初次接触 SPL 的程序员对此比较陌生,参考本文可以快速上手,完成常见数据转存的工作。 这里给出了适合一般场景的样例代码,特殊情 ..
-
业务系统产生的明细数据通常要经过加工处理,按照一定逻辑计算成需要的结果,用以支持企业的经营活动。这类数据加工任务一般会有很多个,需要批量完成计算,在银行和保险行业常常被称为跑批,其它像石油、电 ..