-
数据分析需要探索式 对于数据分析,许多任务并非固定的查询,而是需要灵活的分析和判断。比如,电商数据中的用户行为分析、产品推荐、库存优化,或者金融行业的风险评估和客户分类等,都往往没有预先固定的 ..
-
在很多商业场景中,存在一种数据不平衡的现象。比如银行贷款违约,违约的人只是很小一部分人;保险欺诈,欺诈者也是个别现象;还有产品质量中不良品的比例、工业生产中非计划停车现象等等……。这些罕见现象 ..
-
1. 准备历史数据。 在营销场景中,要预测的目标是客户的购买行为,需要搜集一些可能会影响购买行为的信息字段,比如客户的年龄、学历、工作、收入、家庭结构、生活习惯、购物偏好,以及产品的特点、促销 ..
-
强计算和交互性的两难 Excel 和 BI 是常用的数据分析工具,很适合完成初级的数据分析任务,比如统计各月销售总额,计算各组的平均订单金额和购买频次等。但随着业务需求升级,更复杂的任务用 E ..
-
明确目标,准备数据 首先要明确目标,知道要预测什么东西。 比如银行放贷款时,希望预测出贷款人违约的可能性,从而判定是否放贷以及贷款利率。 保险公司制定保费时,希望预测出客户的理赔风险,从而制定 ..
-
什么是数据挖掘? 人们总是希望能预测未来,比如预测明天的天气,预测某地区的房价,预测下个季度的销量,预测客户的购买喜好等等。 [图片] 那么,我们到底有没有办法做预测呢? 举个例子。 傍晚,路 ..
-
-
https://c.raqsoft.com.cn/article/1729501572063 利用订单表,订单明细表,产品信息表,员工信息表,出差信息表,客户信息表,城市信息表,计算出差时间大 ..
-
[链接] 现有门店信息表、订单表、订单明细表、订单回款表、门店线上评分表、门店线下评分表、门店考核成绩表。完成以下计算: 门店信息表: storeid state … s101 Califor ..
-
https://c.raqsoft.com.cn/article/1729257192856 8.1.1 普通外键关联 销售记录表、城市信息表、产品信息表部分内容如下: 销售记录表 (事实表) ..
-
[链接]Talk is cheap. Let’s show the code [链接]1. 计算用户会话次数 用户行为数据表 userid action_type action_time U1 ..
-
下载测试文本 结构化文本计算需求 结构化文本文件是常见的数据存储方式,比如这个score.txt,记录了所有班级学生的成绩,第一行是列名,之后每一行是一个学生的数据,行内用制表符分隔。 [图片 ..
-
https://c.raqsoft.com.cn/article/1729257054372 现有学生成绩表如下: [图片] 1. 将其扩展为 STUDENTID,SUBJECT,SCORE ..
-
[链接] 1. 单字段排名 2. 多字段排名 [链接]SPL A B 1 =file(“EMPLOYEE.csv”).import@tc() 2 =A1.ranks(BIRTHDAY) / 出 ..
-
[链接] 1. 升序排名 2. 降序排名 3. 去掉重复成员后再排名 4. 重复成员算均值后再排名 [链接]SPL A B 1 [2,1,3,4,8,5,2,0] 2 =A1.ranks() ..
-
[链接] 1. 单字段排序 2. 多字段排序 3. 排序后的位置 4. 随机排序 [链接]SPL A B 1 =file(“EMPLOYEE.csv”).import@tc() 2 =A1.s ..
-
[链接] 1. 升序排序 2. 降序排序 3. 排序后的位置 4. 随机排序 [链接]SPL A B 1 [13,30,45,23,42,98,61] 2 =A1.sort() [13,23, ..
-
[链接] 现有两个序列,一个是日期序列,一个是股价序列,它们一一对应且日期序列有序,请完成以下计算任务: 1. 获取按股价排序后的日期序列; 2. 计算股价最高那天的涨幅; 3. 计算股价最高 ..
-
[链接] [链接]6.2.1 简单成员选出 1. 偶数成员 2. 偶数位置的成员 3. 大于 30 的成员 4. 比前 1 值大的成员 5. 局部极大值 (等于之前 1 个值、当前值、之后 1 ..
-
[链接] [链接]6.1.1 成员定位 1. 获取 5 在序列中的位置 2. 判断 5 是否在序列中 [链接]SPL A B 1 [2,9,7,7,2,2,9,3,3,5] 2 =A1.pos ..
-
[链接] 1. 计算各销售员的累积销售额 2. 为每个销售员的订单从 1 开始编号,并将 ORDERID 替换为该编号 [链接]SPL A B 1 =file(“SALES.csv”).imp ..
-
[链接] 二分法求解,lnx+2x-6=0 在区间 [0,3] 内的解。 [链接]SPL A B 1 1E-6 2 =y=1,1000.iterate((x=(~~(1)+~~(2))/2,y ..
-
[链接] 1. 用迭代函数实现求和 (sum)、累计求和(cum)、最大值(max)、最小值成员(maxp) 计算 2. 计算 10 号销售员的累积销售额 3. 为 10 号销售员的订单从 1 ..
-
SQL 经常跑得很慢 SQL 是最常用的大数据计算语言,但是,SQL 经常跑得很慢,严重浪费硬件资源。 某银行的反洗钱准备计算,36 亿行,11 节点的 Vertica 集群跑了 1.5 小时 ..
-
[链接] 1. 各部门的平均工资 2. 各部门工资最高的成员 3. 各部门工资最高的三个员工 4. 各部门 EID 最小的员工 (EID 有序) [链接]SPL A B 1 =file(“EM ..