图书 •
860 引用 •
244 回帖 •
4 关注
博客
关注
-
有产品类别表如下,其中 ID 字段是主键,需找出 ID 字段值为 5 的成员序号: Category ID Name Description … 脚本: A 1 =connect(“db”) ..
-
计算两个日期时间数据相差的分钟数。 对于每个 ID, Value 第一次出现 1 开始累计到 0 为止,如果 0 一直没有出现,就和系统时间比。部分数据如下: ID Time Value 1 ..
-
有一组给定的x1,x2和y的值如下表,用lasso回归拟合数据 x1 1.1 1.4 1.7 1.7 1.8 1.8 1.9 2.0 2.3 2.4 x2 1.1 1.5 1.8 1.7 1. ..
-
序表中数据聚合时,非重复计数。分析数据文件中哪个字段最适合被设定为主键列。 PassengerId Survived Pclass Name Sex Age 1 0 3 “Braund, Mr ..
-
例 1: 有数据如下: Table1.xlsx: Quantity Price 221 87 33 73 162 227 403 288 78 213 374 152 Table2.xlsx: ..
-
在结构相同的多个表中,根据主键将其中的记录有序归并。 根据 6 月 1 日至 20 日期间的体温情况记录,查找曾经连续发烧 3 日或以上的同学名单。 StudentID Name Fever ..
-
有数据如下: [图片] 把符合 ID,Name,Item 一致,Value 值正负抵消的行数删掉: =spl('=E(?1).group(ID,Name,Item).select(~.sum( ..
-
多个相互关联的表有序,其中包括大数据表,使用有序归并筛选记录。 根据相互关联的订单表、订单明细表和客户表,查询总销售额超过 1 万的客户,其中订单明细表和订单表数据量很大,无法全部加载到内存。 ..
-
两个相互关联的表,获得它们的叉积后过滤计算。 根据三明治表和配料表,查询哪两种三明治的配料最接近。 Sandwich: ID Name Price 1 BLT 5.5 2 Reuben 7.0 ..
-
集合 A 和 B 的并集是由所有属于集合 A 或属于集合 B 的成员所组成的集合,但是不包括重复成员。比如集合 [1,2] 与[1,3]的并集,是集合[1,2,3]。值得注意的是,重复成员 1 ..
-
有数据如下: [图片] 按 Date 的年月统计 Val 的和,结果如下: [图片] 代码如下: =spl('=E(?1).run(Date=date(''18991230'',''yyyyM ..
-
有一列混合了字符和数字的数据,其中数字可能在多处出现,且出现规律不定: [图片] 将每一行中的所有数字分离出来,并将分离出来的结果放置到 B 列,期望效果如下图: [图片] 在 B1 写入: ..
-
数据中远离其他点的数据是不常见数据,比较数据中的每个点与其他所有点的距离(绝对差)之和,以最小距离和作为基准,超过该基准一定倍数的点就是异常值。 找出距离其他点都“不远”的数据,可以认为这些是 ..
-
在泰坦尼克数据中按照7:3 比例随机划分训练集和测试集 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.group(rand()<=0.3 ..
-
比率是指两个变量相除,用于连续型变量 比率也是特征组合的一种方法,特征组合是为了弥补线性模型无法表达非线性性质的不足的补充,有助于提升线性模型的表达能力 注意:在比率计算中,做分母的变量不能有 ..
-
使用代码解析序表中的字符型字段。 求 80 后的平均工资,年龄需要从证件号码中提取。员工表部分数据如下: ID Name Identification Salary 1 Rebecca Dri ..
-
SPL 中提供 pearson()和spearman()函数,来评估两变量之间的相关程度 A B 1 =[7,9,6,23,56,1,6] =[6,1,56,23,6,9,7] 2 =pear ..
-
查找子表中无法指向主表的记录。在相互关联的产品表和类别表中,查询产品类别未出现在类别表中的有哪些。 Product ID Name CategoryID … Category ID Name ..
-
有儿童身高评分数据如下:A1、B1、C1 是年龄段,其下是身高 (cm),D 列是评分。 [图片] 有儿童信息数据如下: [图片] 现在要根据年龄 Age 和身高 Height 到 Sheet ..
-
Sybase 数据库中有表 SAMPLE,数据如下所示: SECURITY_ID DATE REP 2256 2020-01-01 0 2257 2020-01-02 1 2258 2020- ..
-
有如下数据,在列 Header1 中存储了一些索引号,但这个索引号可能有重复值,就像下图中红框所示有多个 101: [图片] [图片] 将 data 页的 Header2,Header3 的数 ..
-
有过去数年每个月销售额前三的客户名单,想判断 RATTC 这个客户过去每一年是否曾经进过单月销售额前三。 Year Month Top3 2019 1 ANTON,AROUT,BERGS 20 ..
-
递归运算是指直接或者间接地调用自身的运算方法。比如我们熟悉的汉诺塔问题,就是典型的递归运算。在实际应用中递归查询问题也很常见,比如我们想知道某个部门有哪些上级机构。单纯的查找这个部门的上级机构 ..
-
计算 N 天后的日期。 查询 2015 年,第 2 天内发货且发货后 3 天内到货的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Arrival ..
-
提取单变量缺失信息 为每个包含缺失值的变量建立一个哑变量形式的新变量,用于将该变量的缺失信息标识出来。 在SPL中A.mi()和P.mi()会自动生成一个变量来标记缺失信息 例如,对titan ..