图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
单表自连接后,对所有记录递归查找指定字段的各级引用。 根据某公司组织结构表,查询各部门的级别(总部是 1 级,分公司 2 级,依此类推)。部分数据如下: ID ORG_NAME PARENT_ ..
-
递归运算是指直接或者间接地调用自身的运算方法。比如我们熟悉的汉诺塔问题,就是典型的递归运算。在实际应用中递归查询问题也很常见,比如我们想知道某个部门有哪些上级机构。单纯的查找这个部门的上级机构 ..
-
也称为离差标准化,是对原始数据的线性变换,使结果值映射到 [0 - 1] 之间。 转换函数:x∗=x−min/max−min,max:样本数据最大值,min:样本数据最小值 例如,房价预测的数 ..
-
将两个日期之间时间段等分为 N 段。 从 2014/01/20 开始,到 2015/01/20 之前(不含)的销售记录,按日期等分到 4 组,并分别存到文件中。销售表部分数据如下: ORDER ..
-
列出两个日期之间的日期序列。 重叠部分不重复计数时,求多个时间段包含的总天数。部分数据如下: ID Start End 1 2012/07/04 2012/07/16 2 2012/07/06 ..
-
date()函数可以将多个含有日期信息变量组合为日期变量 [图片] A 1 =create(year,month,day) 2 =A1.insert(100) 3 =A1.run(year=2 ..
-
列出两个日期之间的工作日序列。 列出从 2020/04/27 到 2020/05/08 区间内每个工作日值班的人员名称。考勤表部分内容如下: ID Date Name 1 2020/04/27 ..
-
计算 N 个工作日后的日期。 统计 2014 年中,各员工有几次超过 10 个工作日还没有解决客户问题。部分数据如下: ID CustomerID EmployeeId QuestionDat ..
-
线性回归模型填补是模型填补的一种,以需要填补的变量为因变量,其他变量为自变量,利用因变量非缺失部分对应的样本来训练模型,然后用模型对缺失部分的数据进行填补。 例如,使用线性回归模型填补tita ..
-
计算 N 个月前的日期。 查询 2014/05/21 之前三个月内的总销售额,销售表部分数据如下: ORDERID CUSTOMERID EMPLOYEEID ORDERDATE AMOUNT ..
-
根据出生日期计算年龄。 查询每个部门员工的平均年龄。员工表如下: ID NAME BIRTHDAY HIREDATE DEPT SALARY 1 Rebecca 1974/11/20 2005 ..
-
K-means聚类又称为快速聚类,是一种需要事先确定类别个数的聚类方法。使用K-means聚类可以将全部样本分成若干个组,如果假定包含缺失值的变量在不同分组具有不同的取值,则可以使用该变量非缺 ..
-
计算每个季度的日均销售额。 计算 2014 年每个季度的日均销售额。销售表部分数据如下: ORDERID CUSTOMERID EMPLOYEEID ORDERDATE AMOUNT 1040 ..
-
计算一周的第一日和最后一日。 当前日期是 2020/02/17,求上证指数上一周的涨幅。部分数据如下: Date Open Close Amount 2020/02/17 2924.9913 ..
-
例如在泰坦尼克的数据中,”Embarked”字段有两个缺失值,直接删除缺失的样本 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.select( ..
-
计算两个日期时间数据相差的分钟数。 对于每个 ID, Value 第一次出现 1 开始累计到 0 为止,如果 0 一直没有出现,就和系统时间比。部分数据如下: ID Time Value 1 ..
-
计算两个日期时间数据相差的天数。 查询 2015 年发货时间超过 30 天的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Amount 1024 ..
-
数据中常有一些质量比较差或对建模没有意义的变量,可以定义一些规则,对其进行直接删除,以减少计算量,比如 (1)缺失率过高的变量 (2)单值变量 (3)分类数过多的变量 A 1 =file('D ..
-
计算 N 天后的日期。 查询 2015 年,第 2 天内发货且发货后 3 天内到货的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Arrival ..
-
解析 HTML 文件,读出序表。 从 HTML 文件中解析出成绩表,并统计每个学生的总分。 … CLASSSTUDENTIDSUBJECTSCORE Class one1Math77 Cl ..
-
MAD 定义为,一元序列 Xi同其中位数偏差的绝对值的中位数 MAD=median(|Xi−median(X)|) 例如,使用MAD方法检测Fare变量的异常值,阈值取3.5 A 1 =fil ..
-
解析 HTML 文件,分析正文中的信息。 查找 HTML 文件的正文中有哪些数字。文件部分内容如下: Stack Overflow - Where Developers Learn, S ..
-
将标准 SQL 语句翻译成指定数据库所使用的格式。 某公司的销售数据,部分存储在数据库 oracle 中,部分存储在数据库 mysql 中。求 2015 年 3 月 18 日到 7 月 18 ..
-
可能的异常值:|z|>2 高度可疑异常值:|z|>3 [图片] 使用Z-score方法对Fare变量检测异常值 A 1 =file('D://titanic.csv').impor ..
-
修改 SQL 语句中的过滤条件。 下面的 SQL 语句用于选出销售部门收入大于 10000 的员工,将过滤条件中的部门修改为研发部门。 select EID,NAME,SURNAME,DEPT ..