图书 •
869 引用 •
255 回帖 •
4 关注
博客
关注
-
计算 N 天后的日期。 查询 2015 年,第 2 天内发货且发货后 3 天内到货的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Arrival ..
-
两个表相互关联,计算叉积时使用左连接。 根据相互关联的社区人员表和年龄分段表,查询社区居民所处的年龄段。 Community: ID Name Age 1 David 28 2 Daniel ..
-
对于按照一定次序排列的数据进行计算,经常会遇到跨行引用的情况,比如股票价格相比前一天的涨幅是多少。 SPL 支持在循环计算时,通过相对位置进行相邻记录的引用。 求上证指数每天收盘价较前日上涨了 ..
-
有如下交叉表数据,列方向是产品规格的宽度,行方向是长度: [图片] 现在想要把数据变成行式列表,规格显示为宽度 * 长度,如下图所示: [图片] 代码如下: =spl('=E(?1).pivo ..
-
根据成绩表,求前两名的学生记录序号。 STUDENTID SCORE 1 84 2 77 3 69 4 81 5 80 … … 脚本: A 1 =connect(“db”) 2 =A1.que ..
-
mcumsum(A, n) 对矩阵 A 的元素在第 n 层维度累计求和 A 1 [[1,0,2,3],[0,71,5,6],[0,0,6,5],[35,53,2,3],[35,8,4,2]] ..
-
有一季度每月销售额排名表: [图片] 选出包含一季度总销售额前三产品的月份 (且要求顺序一致): A 1 =E(‘A1:D16’) 2 =A1.groups(ProductName;sum(S ..
-
马氏距离计算观测样本在总体样本中的距离,不受量纲的影响。dism(X,Y,C)用来计算向量X与向量Y在协方差矩阵C下的马氏距离。样本数要大于维数。例如同样上述5 个样本,计算两两之间的马氏距离 ..
-
取出指定字段前 N 名 / 后 N 名的记录。根据成绩表,求各班各科前两名的学生 ID。 CLASS STUDENTID SUBJECT SCORE Class one 1 English 8 ..
-
根据课程表和选课表,查询同时选修了 Matlab 和 Modern wireless communication system 课程的学生。部分数据如下: COURSE: ID NAME TE ..
-
有日销售统计表如下所示,请算出每种产品日销售额超过 1000 的天数。 Date Product Sales 2022-01-01 00:00:00 Cereal 98.0000 2022-0 ..
-
还是上一小节的样本数据,用岭回归进行拟合 A 1 [[1.1,1.1],[1.4,1.5],[1.7,1.8],[1.7,1.7],[1.8,1.9],[1.8,1.8],[1.9,1.8], ..
-
A.freq(o)计算向量A 中 o 出现的频度,如果 o 省略,则查找空值的频度(包括空字符串和 NA) A 1 [0,NA,2,3,,5,6,3,100,9] 2 =A1.freq(3) ..
-
有数据如下: [图片] 把符合 ID,Name,Item 一致,Value 值正负抵消的行数删掉: =spl('=E(?1).group(ID,Name,Item).select(~.sum( ..
-
提取单变量缺失信息 为每个包含缺失值的变量建立一个哑变量形式的新变量,用于将该变量的缺失信息标识出来。 在SPL中A.mi()和P.mi()会自动生成一个变量来标记缺失信息 例如,对titan ..
-
两个相互关联的表,获得它们的叉积后过滤计算。 根据三明治表和配料表,查询哪两种三明治的配料最接近。 Sandwich: ID Name Price 1 BLT 5.5 2 Reuben 7.0 ..
-
均值填补 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.avg(Age) 3 =A1.run(Age=if(!Age,A2,Age)) 在ti ..
-
对两个二维表中关键列的内容进行比对:处理此问题可以把数据读成序表,取出关键列的值组成一个集合,然后通过两个集合的运算得出结果。 有 2018、2019 年的销售订单表数据如下,两个 Sheet ..
-
在SPL中可以使用pearson和spearman来评估变量之间关系的函数 例如,在房价预测的数据中,分析房屋的居住面积GrLivArea和销售价格SalePrice之间的关系 A 1 =fi ..
-
序表中数据聚合时,非重复计数。分析数据文件中哪个字段最适合被设定为主键列。 PassengerId Survived Pclass Name Sex Age 1 0 3 “Braund, Mr ..
-
欠抽样是通过减少多数类样本的样本数量来实现样本均衡。其中比较简单直接的方法就是随机去掉一些数据来减少多数类样本的规模。 例如,泰坦尼克数据中目标变量Survived是一个取值为0,1的二值变量 ..
-
mfind(A,n),在A中查找前n个非0 成员位置 A 1 [0,6,0,23,56,1,0] 2 =mfind(A1,3) 3 =mfind(A1) 4 =mfind(A1,20) A1 ..
-
工业生产中,可能会有两个或者多个仪表协同工作的情况,如温度和压力,阀门开度和流量等。把多个时间序列形成的序列称为多维时间序列,用矩阵X表示。 [图片] X是m维时间序列,它的第i行是m个时间序 ..
-
多个相互关联的表有序,其中包括大数据表,使用有序归并筛选记录。 根据相互关联的订单表、订单明细表和客户表,查询总销售额超过 1 万的客户,其中订单明细表和订单表数据量很大,无法全部加载到内存。 ..
-
有数据如下: [图片] 将行内数据打乱: =spl('=clipboard(E(?1.(~.sort(rand()))))',A1:D5) [图片] 将列内数据打乱: =spl('=clipb ..