计算&AI •
874 引用 •
936 回帖 •
446 关注
博客
关注
-
下载测试文本 结构化文本计算需求 结构化文本文件是常见的数据存储方式,比如这个score.txt,记录了所有班级学生的成绩,第一行是列名,之后每一行是一个学生的数据,行内用制表符分隔。 [图片 ..
-
明确目标,准备数据 首先要明确目标,知道要预测什么东西。 比如银行放贷款时,希望预测出贷款人违约的可能性,从而判定是否放贷以及贷款利率。 保险公司制定保费时,希望预测出客户的理赔风险,从而制定 ..
-
-
select sum(l_extendedprice * (1 - l_discount)) as revenue from lineitem,part where ( p_partkey = ..
-
Excel 数据分析师们的江湖难题 在数据江湖中,Excel 数据分析师们就像一群手握“倚天剑”的侠客,凭借着 Excel 的强大交互性和简便操作,在数据的世界里快意恩仇,行侠仗义。然而,江湖 ..
-
select s_name,s_address from supplier,nation where s_suppkey in ( select ps_suppkey from partsup ..
-
select cntrycode, count(*) as numcust, sum(c_acctbal) as totacctbal from ( select substr(c_phone ..
-
数据分析师的日常离不开各种数据操作,过滤、分组、汇总、排序……,面对这些基本需求,SQL 用起来确实得心应手。比如,查个用户分组销售额、筛选一批重要客户,这样的任务用 SQL 写出来就像英语一 ..
-
select * from ( select s_name, count(*) as numwait from supplier,lineitem l1,orders,nation where ..
-
在很多商业场景中,存在一种数据不平衡的现象。比如银行贷款违约,违约的人只是很小一部分人;保险欺诈,欺诈者也是个别现象;还有产品质量中不良品的比例、工业生产中非计划停车现象等等……。这些罕见现象 ..
-
本文讨论股票连涨问题,为了避免歧义,这里约定:股票连涨天数包括起始的 1 天,比如连涨 5 天意味着这 5 天内股票都在上涨,实际上只有从第 2 天开始的 4 次上涨。 数据结构和样例数据: ..
-
本文讨论股票连涨问题,为了避免歧义,这里约定:股票连涨天数包括起始的 1 天,比如连涨 5 天意味着这 5 天内股票都在上涨,实际上只有从第 2 天开始的 4 次上涨。 数据结构和样例数据: ..
-
数据结构 国家表 world.country [图片] Code 是国家编码,Name 是国家名称,Population 是国家人口。 国家语言表 world.countrylanguage ..
-
背景 与一般事务处理(TP)系统相比,报表中的 SQL 更频繁地使用各种计算函数,计算逻辑也更加复杂,对 SQL 的依赖更强。报表开发中可能应对数据库的变化,不同数据库的 SQL 语法虽大体相 ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 查找股价上穿中位数 T 日股价中位数是指从上市日收盘价到 T 日收盘价的中位数。 ..
-
数据结构和样例数据: [图片] 其中 sid 是股票代码,tdate 是交易日期,close 是收盘价。 1. 计算每日收盘价的 12 日 EMA 某支股票上市第 1 天的 n 日 EMA 为 ..
-
订单数据表记录了近几年的销售订单信息。 [图片] 员工信息表记录了所有员工的基本信息。 [图片] 1. 汇总并关联成宽表 将原始的订单数据汇总到年。然后再和员工信息表进行关联,做成这样一张表格 ..
-
本篇接续《数据分析编程从 SQL 到 SPL:用户事件统计》, 延用用户行为表 actions,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 3、连续 4 天活跃度排名前 ..
-
实时热数据报表,是指能够实时查询全量冷热数据的报表。早期业务只基于单个 TP 数据库时,这种报表并不是什么问题。但数据量大了,要拆分到专门的 AP 数据库后,就不一样了。因为冷热数据分离后,再 ..
-
背景 报表经常会基于多种数据源,如 RDB、NoSQL、文本、Excel、MQ 等。 [图片] 借助逻辑数据仓库可以一定程度上实现多源混算,但其架构往往过于复杂和沉重,需要繁琐的预处理过程以运 ..
-
简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 1、计算每个用户会话次数 一个用户超过 2 天无操作或 e8 事件后 2 ..
-
有销售数据表,记录了销售员每年的销售金额。 [图片] 1. 找出 5 号销售员销售额实现增长的年份 用 Excel 先筛选出 SELLERID 为 5 的数据,然后再判断每年销售额是否增长。 ..
-
数据结构和样例数据: [图片] 表中存储的是 2025 年 1 月 1 日飞机出发、到达城市机场的数据。 其中 FId 是航班号,AircraftId 飞机号,DepCity 出发城市,Arr ..