图书 •
783 引用 •
159 回帖 •
3 关注
博客
关注
-
计算 N 个工作日后的日期。 统计 2014 年中,各员工有几次超过 10 个工作日还没有解决客户问题。部分数据如下: ID CustomerID EmployeeId QuestionDat ..
-
列出两个日期之间的日期序列。 重叠部分不重复计数时,求多个时间段包含的总天数。部分数据如下: ID Start End 1 2012/07/04 2012/07/16 2 2012/07/06 ..
-
计算 N 天后的日期。 查询 2015 年,第 2 天内发货且发货后 3 天内到货的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Arrival ..
-
将标准 SQL 语句翻译成指定数据库所使用的格式。 某公司的销售数据,部分存储在数据库 oracle 中,部分存储在数据库 mysql 中。求 2015 年 3 月 18 日到 7 月 18 ..
-
在SPL中可以使用pearson和spearman来评估变量之间关系的函数 例如,在房价预测的数据中,分析房屋的居住面积GrLivArea和销售价格SalePrice之间的关系 A 1 =fi ..
-
有数据如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 脚本: A 1 =file(“Book1.xlsx”).xlsimport@ ..
-
有数据如下: [图片] 按 Maths、English、PE 三列的和逆序: =spl('=E(?).sort(Maths+English+PE:-1)',A1:E12) [图片] htt ..
-
将两个日期之间时间段等分为 N 段。 从 2014/01/20 开始,到 2015/01/20 之前(不含)的销售记录,按日期等分到 4 组,并分别存到文件中。销售表部分数据如下: ORDER ..
-
使用代码解析序表中的字符型字段。 求 80 后的平均工资,年龄需要从证件号码中提取。员工表部分数据如下: ID Name Identification Salary 1 Rebecca Dri ..
-
将两列字符串的值连接为一列。 查询纽约研发部门员工的全名和收入。员工表如下: ID NAME SURNAME STATE DEPT SALARY 1 Rebecca Moore Califor ..
-
双向转置,行转列,同时列转行。 按渠道分类的销售记录如下: Day Online Store 20190101 2400 1863 20190102 1814 670 20190103 373 ..
-
有时候每条记录计算出的分组序号是多个,我们希望将记录按照序号数列重复性的分配到多个组中。 根据发帖记录表,按标签将帖子分组,并统计各个标签出现频数。发帖记录表部分数据如下: ID Title ..
-
有数据如下: [图片] [图片] 请在 Student 页中,Name 列的右侧增加一列 Score,把 Score 页中的 Score 列数据填到此处,在 Student 页的 C1 中计算 ..
-
原值的波动可能比较频繁,但整体上呈现某一种趋势,主线就是描述这种趋势的衍生序列。 通俗的讲,将原值平滑后就可以描述原值的趋势。平滑化最常见的手段的就是平均,具体到时间序列就是移动平均。 时间序 ..
-
训练集和测试集中0/1 类(目标变量)的比例接近一致 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.group@p(Survived) 3 = ..
-
A.numnorm()和P.numnorm(cn)可以对数值型变量执行标准化处理。 例如房价预测数据中的变量”LotArea”量纲比较大,对其进行归一化 A 1 =T('D://house_p ..
-
有时我们需要把满足多个分组条件的成员,重复分配到所有对应的分组中。 根据城市 GDP 表,分别统计直辖市、一线城市、二线城市的人均 GDP。需要注意的是,分组可能会有重复成员,比如北京既是一线 ..
-
按基准表中指定字段的顺序,将数据分组,每组保留所有匹配成员。适用于关心每组的成员信息,或者需要用这些成员记录继续进行统计的场景。 【例 1】 根据相互关联的员工表和部门表,按部门表中的部门顺序 ..
-
循环中使用迭代计算,自行设置迭代中的计算表达式和终止条件。 根据销售表数据,统计 2014 年第一季度到哪一天完成了销售总额 15 万的季度目标。销售表部分数据如下: OrderID Cust ..
-
我们可以使用相对位置的区间,来引用相邻记录组成的序列。 列出上证指数 2020 年 1 月 1 日至 10 日每天的 20 日收盘均价。上证指数部分数据如下: DATE CLOSE OPEN ..
-
计算两个日期时间数据相差的分钟数。 对于每个 ID, Value 第一次出现 1 开始累计到 0 为止,如果 0 一直没有出现,就和系统时间比。部分数据如下: ID Time Value 1 ..
-
序表中数据聚合时,非重复计数。分析数据文件中哪个字段最适合和 Pclass 字段组合作为主键。 PassengerId Survived Pclass Name Sex Age 1 0 3 “ ..
-
根据股市交易表,选出收盘价涨幅超过 3% 的交易记录。 Date Open Close Amount 2019/12/31 3036.3858 3050.124 2.27E11 2019/12 ..
-
求上证指数 2019 年最后 10 个交易日收盘价较前日的涨幅。部分数据如下: Date Open Close Amount 2019/12/31 3036.3858 3050.124 2.2 ..
-
过抽样是通过增加样本中小类样本的数据量来实现样本均衡。其中较为简单的方式是直接复制小类样本,形成数量上的均衡。 对泰坦尼克样本数据过抽样如下: A 1 =file('D://titanic.c ..