图书 •
860 引用 •
253 回帖 •
4 关注
博客
关注
-
比率是指两个变量相除,用于连续型变量 比率也是特征组合的一种方法,特征组合是为了弥补线性模型无法表达非线性性质的不足的补充,有助于提升线性模型的表达能力 注意:在比率计算中,做分母的变量不能有 ..
-
两个相互关联的表,获得它们的叉积后过滤计算。 根据三明治表和配料表,查询哪两种三明治的配料最接近。 Sandwich: ID Name Price 1 BLT 5.5 2 Reuben 7.0 ..
-
序表中数据聚合时,非重复计数。分析数据文件中哪个字段最适合被设定为主键列。 PassengerId Survived Pclass Name Sex Age 1 0 3 “Braund, Mr ..
-
马氏距离计算观测样本在总体样本中的距离,不受量纲的影响。dism(X,Y,C)用来计算向量X与向量Y在协方差矩阵C下的马氏距离。样本数要大于维数。例如同样上述5 个样本,计算两两之间的马氏距离 ..
-
根据成绩表,求前两名的学生记录序号。 STUDENTID SCORE 1 84 2 77 3 69 4 81 5 80 … … 脚本: A 1 =connect(“db”) 2 =A1.que ..
-
有商品日销售数据如下: [图片] 现在需要以日期为左表头、产品为上表头做一个交叉统计表,如下图所示: [图片] 代码如下: =spl('=E(?1).pivot(SaleDate;Produc ..
-
有日销售统计表如下所示,请算出销售额最大 / 最小的那天的销售额是多少? Date Sales 2022-01-01 00:00:00 98.0000 2022-01-02 00:00:00 ..
-
将字符串拆分为字符序列。 统计某个网页源码里中括号外的逗号数量。网页源码部分内容如下: ABCDEF … 使用函数 A.split() 将字符串拆分成字符序列。 脚本: A B C 1 ..
-
例 1: 有数据如下: Table1.xlsx: Quantity Price 221 87 33 73 162 227 403 288 78 213 374 152 Table2.xlsx: ..
-
波动幅度是描述原值波动大小的衍生序列。 通俗的讲,一段时间内最大值与最小值之差就可以作为波动幅度W。 wi=ma-mi 其中ma和mi是X[-l]i内的最大值和最小值。 但这么做会有隐患,当X ..
-
使用代码解析序表中的字符型字段。 求 80 后的平均工资,年龄需要从证件号码中提取。员工表部分数据如下: ID Name Identification Salary 1 Rebecca Dri ..
-
在SPL中可以使用pearson和spearman来评估变量之间关系的函数 例如,在房价预测的数据中,分析房屋的居住面积GrLivArea和销售价格SalePrice之间的关系 A 1 =fi ..
-
有数据如下: [图片] 按 Date 的年月统计 Val 的和,结果如下: [图片] 代码如下: =spl('=E(?1).run(Date=date(''18991230'',''yyyyM ..
-
计算两个日期时间数据相差的分钟数。 对于每个 ID, Value 第一次出现 1 开始累计到 0 为止,如果 0 一直没有出现,就和系统时间比。部分数据如下: ID Time Value 1 ..
-
多个相互关联的表有序,其中包括大数据表,使用有序归并筛选记录。 根据相互关联的订单表、订单明细表和客户表,查询总销售额超过 1 万的客户,其中订单明细表和订单表数据量很大,无法全部加载到内存。 ..
-
https://c.raqsoft.com.cn/article/1740711477484 根据下面的 J.Marchin 的圆周率计算公式: [图片] 其第 n 项为: [图片] 如果需要 ..
-
相互关联的多个表进行动态行转列,根据字段值动态生成多列,然后将关联查询的数据填入。 根据学生表、成绩表和补考成绩表,计算每位学生的各科成绩、总成绩和补考成绩的汇总表。 [图片] 汇总表形式如下 ..
-
mfind(A,n),在A中查找前n个非0 成员位置 A 1 [0,6,0,23,56,1,0] 2 =mfind(A1,3) 3 =mfind(A1) 4 =mfind(A1,20) A1 ..
-
计算 N 天后的日期。 查询 2015 年,第 2 天内发货且发货后 3 天内到货的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Arrival ..
-
在结构相同的多个表中,根据主键将其中的记录有序归并。 根据 6 月 1 日至 20 日期间的体温情况记录,查找曾经连续发烧 3 日或以上的同学名单。 StudentID Name Fever ..
-
有事件备忘录如下: [图片] 将信息里面的日期都分离出来,并且用分号隔开后放到后面一列,方便以后统计。就像如下这种效果: [图片] 在 B1 写入代码: =spl('=?1.split('' ..
-
问题 此问题的目的是用文本模拟出直方图。 下图是员工信息表,其中 DEPTNO 为员工所在的部门。 EMPNO ENAME DEPTNO 7934 Miller 10 7782 Clark 1 ..
-
有一组给定的x1,x2和y的值如下表,用lasso回归拟合数据 x1 1.1 1.4 1.7 1.7 1.8 1.8 1.9 2.0 2.3 2.4 x2 1.1 1.5 1.8 1.7 1. ..
-
集合 A 和 B 的并集是由所有属于集合 A 或属于集合 B 的成员所组成的集合,但是不包括重复成员。比如集合 [1,2] 与[1,3]的并集,是集合[1,2,3]。值得注意的是,重复成员 1 ..
-
有如下数据,在列 Header1 中存储了一些索引号,但这个索引号可能有重复值,就像下图中红框所示有多个 101: [图片] [图片] 将 data 页的 Header2,Header3 的数 ..