计算&AI •
991 引用 •
1070 回帖 •
471 关注
博客
关注
-
Excel 数据分析师们的江湖难题 在数据江湖中,Excel 数据分析师们就像一群手握“倚天剑”的侠客,凭借着 Excel 的强大交互性和简便操作,在数据的世界里快意恩仇,行侠仗义。然而,江湖 ..
-
Parquet 和 ORC 都是 hadoop 中用于存储数据的列式存储格式, hadoop 提供了 Java API 读写它们的文件,集算器把实现读取文件的 JAVA 代码做了封装,形成更易 ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 查找股价上穿中位数 T 日股价中位数是指从上市日收盘价到 T 日收盘价的中位数。 ..
-
select * from ( select c_name, c_custkey, o_orderkey, o_orderdate, o_totalprice, sum(l_quantity) ..
-
数据结构 就诊记录表 Appointments [图片] appid 是就诊编号,patientid 是患者编号,depid 是科室编号,appdate 是就诊日期。 1. 查询 2020 与 ..
-
select p_brand,p_type,p_size, count(distinct ps_suppkey) as supplier_cnt from partsupp,part wher ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 计算每日收盘价的 12 日 EMA 某支股票上市第 1 天的 n 日 EMA 为 ..
-
下面是某企业的历史销售合同记录Contract.txt: [图片] 去年有销售额而今年没有的客户称为今年的“流失客户”,“流失客户”的数量除以去年的总客户数量为今年“客户流失率”,请找出 20 ..
-
1. 数据准备 学习本课程需要先准备测试数据。可以使用 TPC 官网提供的程序生成测试数据,也可以使用[链接] 提供的方法生成。 准备数据时,要注意数据占用硬盘的空间大小。以 TPCH-Q1 ..
-
select l_shipmode, sum(case when o_orderpriority = '1-URGENT' or o_orderpriority = '2-HIGH' then ..
-
在很多商业场景中,存在一种数据不平衡的现象。比如银行贷款违约,违约的人只是很小一部分人;保险欺诈,欺诈者也是个别现象;还有产品质量中不良品的比例、工业生产中非计划停车现象等等……。这些罕见现象 ..
-
筛选法是一种古老的求不超过自然数 N(N>1)的所有质数的方法。把自然数1~N排列起来。最小的质数是 2,所以先把 1 划去,从 2 开始,把 2 留下,而把 2 后面所有能被 2 整除的数都 ..
-
select s_name,s_address from supplier,nation where s_suppkey in ( select ps_suppkey from partsup ..
-
分组是常见的结构化数据计算,SQL 和 Python 都有相应的语句和函数来处理。不过,和 esProc SPL 提供的分组运算相比,这些语言都弱得多了。 常规的分组一般都会伴随着聚合,比如要 ..
-
四个人打扑克,用一副扑克牌,抽掉大小王,剩余 52 张牌,洗牌后平分给四个人,每人 13 张,并按花色和点数整理。现在用 ,,,表示扑克牌花色,例如 8 表示黑桃 8,K 表示红桃 K,请写一 ..
-
数据分析师的日常离不开各种数据操作,过滤、分组、汇总、排序……,面对这些基本需求,SQL 用起来确实得心应手。比如,查个用户分组销售额、筛选一批重要客户,这样的任务用 SQL 写出来就像英语一 ..
-
create view revenue (supplier_no, total_revenue) as select l_suppkey, sum(l_extendedprice * (1 - ..
-
select sum(l_extendedprice * (1 - l_discount)) as revenue from lineitem,part where ( p_partkey = ..
-
现代数据分析业务(如常见的报表应用)经常要从不同系统中提取数据,这些数据分散在各个地方,格式和存储形式也不一样,更新速度也不统一。CRM 里的销售数据、财务系统里的财务数据,ERP 里的库存数 ..
-
算 24 点游戏是一种经典的用扑克牌来进行的益智游戏。游戏内容是:从一副扑克牌中抽去大小王剩下 52 张,任意抽取 4 张牌,把牌面上的数字(J、Q、K、A 分别代表 11、12、13、1)运 ..
-
简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 《下载测试数据》 1、查找按顺序触发过 e2、e3、e7 事件的用户 顺序事件不要求连续。 ..
-
循环节即为无限循环小数中循环的数字部分。无限循环小数都可以表示为一个分数,所以给定一个分数的分子和分母,就可以求出它的循环节。 用分子和分母求余,判断余数在前面的计算中是否出现过,如果余数没有 ..
-
简化后的账户表 user、访问表 view 的部分数据如下: user: [图片] view: [图片] 《下载测试数据》 1、统计每个账号访问各个产品的分钟数 按账户 id、产品分组汇总出分 ..
-
select 100.00 * sum( case when p_type like 'PROMO%' then l_extendedprice * (1 - l_discount) else ..
-
本篇接续《数据分析编程从 SQL 到 SPL:用户事件统计》, 延用用户行为表 actions,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 3、连续 4 天活跃度排名前 ..