计算&AI •
979 引用 •
1069 回帖 •
466 关注
博客
关注
-
列式存储是提高数据分析计算性能的重要手段。如果数据表的总列数很多而计算涉及的列很少,采用列存就只读取需要的列即可,能够减少硬盘访问量,提高性能。而且,同一列数据往往是同一类型的,甚至有些情况取 ..
-
用 csv 文件存储数据很普遍。类似的还有纯文本文件、tsv 文件等等,这些文件都是平面结构,没有层次关系,数据都存成文本字符。有些 xls 文件也是类似的平面结构。 csv 文件具有简单、通 ..
-
数据结构和样例数据: [图片] 表中存储的是 2025 年 1 月 1 日飞机出发、到达城市机场的数据。 其中 FId 是航班号,AircraftId 飞机号,DepCity 出发城市,Arr ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 查找股价上穿中位数 T 日股价中位数是指从上市日收盘价到 T 日收盘价的中位数。 ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 计算每日收盘价的 12 日 EMA 某支股票上市第 1 天的 n 日 EMA 为 ..
-
本文讨论股票连涨问题,为了避免歧义,这里约定:股票连涨天数包括起始的 1 天,比如连涨 5 天意味着这 5 天内股票都在上涨,实际上只有从第 2 天开始的 4 次上涨。 数据结构和样例数据: ..
-
SQL 经常跑得很慢 SQL 是最常用的大数据计算语言,但是,SQL 经常跑得很慢,严重浪费硬件资源。 某银行的反洗钱准备计算,36 亿行,11 节点的 Vertica 集群跑了 1.5 小时 ..
-
1. 数据准备 学习本课程需要先准备测试数据。可以使用 TPC 官网提供的程序生成测试数据,也可以使用[链接] 提供的方法生成。 准备数据时,要注意数据占用硬盘的空间大小。以 TPCH-Q1 ..
-
select cntrycode, count(*) as numcust, sum(c_acctbal) as totacctbal from ( select substr(c_phone ..
-
select * from ( select s_name, count(*) as numwait from supplier,lineitem l1,orders,nation where ..
-
select s_name,s_address from supplier,nation where s_suppkey in ( select ps_suppkey from partsup ..
-
select sum(l_extendedprice * (1 - l_discount)) as revenue from lineitem,part where ( p_partkey = ..
-
select * from ( select c_name, c_custkey, o_orderkey, o_orderdate, o_totalprice, sum(l_quantity) ..
-
select sum(l_extendedprice) / 7.0 as avg_yearly from lineitem,part where p_partkey = l_partkey a ..
-
select p_brand,p_type,p_size, count(distinct ps_suppkey) as supplier_cnt from partsupp,part wher ..
-
create view revenue (supplier_no, total_revenue) as select l_suppkey, sum(l_extendedprice * (1 - ..
-
select 100.00 * sum( case when p_type like 'PROMO%' then l_extendedprice * (1 - l_discount) else ..
-
select c_count, count(*) as custdist from ( select c_custkey, count(o_orderkey) c_count from cus ..
-
select l_shipmode, sum(case when o_orderpriority = '1-URGENT' or o_orderpriority = '2-HIGH' then ..
-
select ps_partkey, sum(ps_supplycost * ps_availqty) as value from partsupp, supplier, nation whe ..
-
select * from ( select c_custkey,c_name, sum(l_extendedprice * (1 - l_discount)) as revenue, c_a ..
-
select nation, o_year, sum(amount) as sum_profit from ( select n_name as nation, extract(year fr ..
-
select o_year, sum(case when nation = 'CHINA' then volume else 0 end) / sum(volume) as mkt_share ..
-
select supp_nation, cust_nation, l_year, sum(volume) as revenue from ( select n1.n_name as supp_ ..
-
select sum(l_extendedprice * l_discount) as revenue from lineitem where l_shipdate >= date '1 ..