图书 •
860 引用 •
253 回帖 •
4 关注
博客
关注
-
计算 N 天后的日期。 查询 2015 年,第 2 天内发货且发货后 3 天内到货的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Arrival ..
-
在SPL中可以使用pearson和spearman来评估变量之间关系的函数 例如,在房价预测的数据中,分析房屋的居住面积GrLivArea和销售价格SalePrice之间的关系 A 1 =fi ..
-
有一组给定的x1,x2和y的值如下表,用lasso回归拟合数据 x1 1.1 1.4 1.7 1.7 1.8 1.8 1.9 2.0 2.3 2.4 x2 1.1 1.5 1.8 1.7 1. ..
-
集合 A 和 B 的并集是由所有属于集合 A 或属于集合 B 的成员所组成的集合,但是不包括重复成员。比如集合 [1,2] 与[1,3]的并集,是集合[1,2,3]。值得注意的是,重复成员 1 ..
-
对两个二维表中关键列的内容进行比对:处理此问题可以把数据读成序表,取出关键列的值组成一个集合,然后通过两个集合的运算得出结果。 有 2018、2019 年的销售订单表数据如下,两个 Sheet ..
-
如下数据中有序存放着多种部件及其金属子部件,当 Level=2 时,表示该行为部件(汇总行),当 Level=3 时,表示该行为子部件。Material 列和 Proportion 列分别存放 ..
-
在结构相同的多个表中,根据主键将其中的记录有序归并。 根据 6 月 1 日至 20 日期间的体温情况记录,查找曾经连续发烧 3 日或以上的同学名单。 StudentID Name Fever ..
-
欠抽样是通过减少多数类样本的样本数量来实现样本均衡。其中比较简单直接的方法就是随机去掉一些数据来减少多数类样本的规模。 例如,泰坦尼克数据中目标变量Survived是一个取值为0,1的二值变量 ..
-
Sybase 数据库中有表 SAMPLE,数据如下所示: SECURITY_ID DATE REP 2256 2020-01-01 0 2257 2020-01-02 1 2258 2020- ..
-
有产品类别表如下,其中 ID 字段是主键,需找出 ID 字段值为 5 的成员序号: Category ID Name Description … 脚本: A 1 =connect(“db”) ..
-
提取单变量缺失信息 为每个包含缺失值的变量建立一个哑变量形式的新变量,用于将该变量的缺失信息标识出来。 在SPL中A.mi()和P.mi()会自动生成一个变量来标记缺失信息 例如,对titan ..
-
查找子表中无法指向主表的记录。在相互关联的产品表和类别表中,查询产品类别未出现在类别表中的有哪些。 Product ID Name CategoryID … Category ID Name ..
-
有数据如下: [图片] 将行内数据打乱: =spl('=clipboard(E(?1.(~.sort(rand()))))',A1:D5) [图片] 将列内数据打乱: =spl('=clipb ..
-
在泰坦尼克数据中按照7:3 比例随机划分训练集和测试集 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.group(rand()<=0.3 ..
-
SPL 中提供 pearson()和spearman()函数,来评估两变量之间的相关程度 A B 1 =[7,9,6,23,56,1,6] =[6,1,56,23,6,9,7] 2 =pear ..
-
在两个表中,根据关联条件筛选记录并计算。 根据相互关联的科目表和选课表,查询有多少学生选修了 Matlab 课程。 [图片] 使用 A.join() 函数的 @i 选项,删除不匹配的记录。 脚 ..
-
有数据如下: [图片] [图片] Sheet1 的 bid、cid 与 Sheet2 的 bid、cid 对应关联,求 Sheet2 中对应的 aids,在 C2 中写入公式: A 1 =E( ..
-
有过去数年每个月销售额前三的客户名单,想判断 RATTC 这个客户过去每一年是否曾经进过单月销售额前三。 Year Month Top3 2019 1 ANTON,AROUT,BERGS 20 ..
-
有日销售额统计表如下所示,找出出现连续三天及以上销售额均上涨的日期记录: Date Sales 2022-01-01 00:00:00 98.0000 2022-01-02 00:00:00 ..
-
有了前面的准备工作,我们就可以实现形状发现任务了。 先设定参数: 特征指数名组合记为Nm Nm=[f1,f2,…,fm] 其中fi是第i个特征指数名。 特征指数组合对应的取值范围记为Ag。 A ..
-
对两个结构相同的大数据表归并统计,两个表中有部分数据重复。 数据库 db1 和 db2 中分别有结构相同的销售记录表 Sales,数据量大无法装载进内存,统计 2014 年每个客户的销售额。 ..
-
集合 A 和 B 的交集是指由所有属于集合 A 且属于集合 B 的成员所组成的集合。比如集合 [1,2,3] 与[1,3,5]的交集,是集合[1,3]。 某商家有网店和实体店铺两种销售渠道,其 ..
-
有运费标准表如下: [图片] 有运输订单表如下: [图片] 根据运费标准表,求实际运费,在 D2 写入: A 1 =spl('=E(?1).select@1(City==?2) 2 =A1.F ..
-
[链接]约定 大多数的 Python 代码都会用到 pandas 和 numpy 这两个包,所以默认 Python 代码开始都会导入这两个包。即: import pandas as pd im ..
-
有如下数据,在字段 Header1 中存储了一些索引号,但这个索引号可能有重复值,就像下图中红框所示有多个 101: [图片] [图片] 将 data 页的数据按 Target 页的顺序排序, ..