计算&AI •
990 引用 •
1070 回帖 •
471 关注
博客
关注
-
集合在计算机中一般都存储为数组形式,其成员天然会有个位置。数据表本质上是记录的集合,也会被存储成数组,作为成员的记录也有位置的概念。而实际应用中确实有很多分析计算都是位置相关的,但 SQL 把 ..
-
标准 SQL 中提供了五种最常用的聚合运算:SUM/COUNT/AVG/MIN/MAX,都是对集合计算出单值。 比如日志表中找出用户 1001 第一次登录的时间,SQL 很简单: SELECT ..
-
早期 SQL 对有序计算极端不适应,理论上可以写,但实际的麻烦程度基本上等同于不能用。 在引入窗口函数后,有序计算得到了一定的改善,但 SQL 的基础还是无序集合,即使打了窗口函数这样的补丁也 ..
-
分组是常见的结构化数据计算,SQL 和 Python 都有相应的语句和函数来处理。不过,和 esProc SPL 提供的分组运算相比,这些语言都弱得多了。 常规的分组一般都会伴随着聚合,比如要 ..
-
列式存储是提高数据分析计算性能的重要手段。如果数据表的总列数很多而计算涉及的列很少,采用列存就只读取需要的列即可,能够减少硬盘访问量,提高性能。而且,同一列数据往往是同一类型的,甚至有些情况取 ..
-
用 csv 文件存储数据很普遍。类似的还有纯文本文件、tsv 文件等等,这些文件都是平面结构,没有层次关系,数据都存成文本字符。有些 xls 文件也是类似的平面结构。 csv 文件具有简单、通 ..
-
数据结构和样例数据: [图片] 表中存储的是 2025 年 1 月 1 日飞机出发、到达城市机场的数据。 其中 FId 是航班号,AircraftId 飞机号,DepCity 出发城市,Arr ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 查找股价上穿中位数 T 日股价中位数是指从上市日收盘价到 T 日收盘价的中位数。 ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 计算每日收盘价的 12 日 EMA 某支股票上市第 1 天的 n 日 EMA 为 ..
-
本文讨论股票连涨问题,为了避免歧义,这里约定:股票连涨天数包括起始的 1 天,比如连涨 5 天意味着这 5 天内股票都在上涨,实际上只有从第 2 天开始的 4 次上涨。 数据结构和样例数据: ..
-
SQL 经常跑得很慢 SQL 是最常用的大数据计算语言,但是,SQL 经常跑得很慢,严重浪费硬件资源。 某银行的反洗钱准备计算,36 亿行,11 节点的 Vertica 集群跑了 1.5 小时 ..
-
1. 数据准备 学习本课程需要先准备测试数据。可以使用 TPC 官网提供的程序生成测试数据,也可以使用[链接] 提供的方法生成。 准备数据时,要注意数据占用硬盘的空间大小。以 TPCH-Q1 ..
-
select cntrycode, count(*) as numcust, sum(c_acctbal) as totacctbal from ( select substr(c_phone ..
-
select * from ( select s_name, count(*) as numwait from supplier,lineitem l1,orders,nation where ..
-
select s_name,s_address from supplier,nation where s_suppkey in ( select ps_suppkey from partsup ..
-
select sum(l_extendedprice * (1 - l_discount)) as revenue from lineitem,part where ( p_partkey = ..
-
select * from ( select c_name, c_custkey, o_orderkey, o_orderdate, o_totalprice, sum(l_quantity) ..
-
select sum(l_extendedprice) / 7.0 as avg_yearly from lineitem,part where p_partkey = l_partkey a ..
-
select p_brand,p_type,p_size, count(distinct ps_suppkey) as supplier_cnt from partsupp,part wher ..
-
create view revenue (supplier_no, total_revenue) as select l_suppkey, sum(l_extendedprice * (1 - ..
-
select 100.00 * sum( case when p_type like 'PROMO%' then l_extendedprice * (1 - l_discount) else ..
-
select c_count, count(*) as custdist from ( select c_custkey, count(o_orderkey) c_count from cus ..
-
select l_shipmode, sum(case when o_orderpriority = '1-URGENT' or o_orderpriority = '2-HIGH' then ..
-
select ps_partkey, sum(ps_supplycost * ps_availqty) as value from partsupp, supplier, nation whe ..
-
select * from ( select c_custkey,c_name, sum(l_extendedprice * (1 - l_discount)) as revenue, c_a ..