图书 •
869 引用 •
255 回帖 •
4 关注
博客
关注
-
有数据如下: [图片] 将数据按照班级 (升序)、成绩(降序) 的规则排序: =spl('=E(?1).sort(Class,Maths:-1)',A1:C12) [图片] https://c ..
-
除了对变量本身做一些数学转换外,也可衍生一些反映和目标变量关系的变量,比如目标阳性样本比例,Odds encoding,log-odds encoding,数值目标均值 例如,泰坦尼克的目标变 ..
-
对数变换一般用于金融数据,可以把指数增长型的数据转化为线性增长 例如: A 1 =[1.26,1.58,2,2.51,3.16,3.98,5.01,6.31,7.94,10] 2 =A1.(l ..
-
上一节中介绍的异常发现方法是将“聚集”在一起的点视为常见点,“分散”的点视为异常点,“聚集”通常是无规则的,只要在多维空间中距离近的点就算“聚集”。不过,有时我们会发现某些场景的“聚集”会有强 ..
-
在拆分字符串时,将字串解析为合适类型的数值。 有课程表和选课表,查询有哪些课没有学生选修。其中选课表可以多选,用逗号分隔,部分数据如下: Course: ID NAME TEACHERID 1 ..
-
covm(A)用来计算矩阵的协方差矩阵 A 1 [[8,1,16],[3,5,7],[4,9,2]] 2 =covm(A1) A2计算A1 的协方差矩阵
-
有如下产品日销售额表: OrderDate ProductName Sales 1996-07-04 Aniseed Syrup 51919.0000 1996-07-04 Chai 2116 ..
-
有数据如下: [图片] 按 Year,Quarter 分组,统计每个季度的总销售额: =spl('=E(?1).groups(Year,Quarter;sum(Sales):Sales)',A ..
-
将字符串与其他类型的数值连接在一起。 下面是两个文本,在文本 2 中查找文本 1 的字符串,希望按下面形式返回: file1 like parks went out go out file2 ..
-
循环中使用迭代计算,自行设置迭代中的计算表达式和终止条件。 根据销售表数据,统计 2014 年第一季度到哪一天完成了销售总额 15 万的季度目标。销售表部分数据如下: OrderID Cust ..
-
有日销售统计表如下所示,请算出日平均销售额是多少? Date Sales 2022-01-01 00:00:00 98.0000 2022-01-02 00:00:00 174.0000 20 ..
-
有数据如下: [图片] 将数据转换为如下形式: [图片] 代码如下: A 1 =‘Sheet1!A1:C8’ 2 =A1.group@u(~(1)) 3 =A2.(transpose(~.(~ ..
-
有数据如下: [图片] 第1行是每个数据的国家代码,第2行是每个数据的其他列名,第3行是每列对应的数值。现在要将该文件整理成规范的行式数据,结果如下: [图片] 代码如下: A 1 =tran ..
-
例如在泰坦尼克的数据中,”Embarked”字段有两个缺失值,直接删除缺失的样本 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.select( ..
-
变量交互是指两个变量相乘,可以是数值变量*数值变量,也可以是分类变量*分类变量。 组合特征是特征工程中非常重要的方法之一,它将两个或更多的类别属性组合成一个。当组合的特征要比单个特征更好时,这 ..
-
过抽样是通过增加样本中小类样本的数据量来实现样本均衡。其中较为简单的方式是直接复制小类样本,形成数量上的均衡。 对泰坦尼克样本数据过抽样如下: A 1 =file('D://titanic.c ..
-
遍历目录,递归调用脚本汇总文件。 遍历指定目录及其子目录下所有文本类型文件,将每个文件中的第 17 行汇总到一个文件中。 [图片] 文本类型文件示例: 16 … 17 Middleware f ..
-
在中国行政区划表中,查询河北省下属区县。部分数据如下: ID NAME PARENT_ID 1 China 0 11 Beijing 1 12 Tianjin 1 13 Hebei 1 … … ..
-
有数据如下: [图片] 按 Maths、English、PE 三列的顺序组合排名(从大到小),在 F2 中写入: =spl('=?1.rank@z(?2.conj())',C$2:E$12,C ..
-
训练集和测试集中0/1 类(目标变量)的比例接近一致 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.group@p(Survived) 3 = ..
-
线性回归模型填补是模型填补的一种,以需要填补的变量为因变量,其他变量为自变量,利用因变量非缺失部分对应的样本来训练模型,然后用模型对缺失部分的数据进行填补。 例如,使用线性回归模型填补tita ..
-
cov(A,B),用来计算两个向量的协方差 A B 1 =[7,9,6,23,56,1,6] =[6,1,56,23,6,9,7] 2 =cov(A1,B1) A2 计算A1 和 B1 的协方 ..
-
循环时迭代计数,根据计数值筛选。 根据销售表,统计出 2014 年每个月达到 20 笔订单所需天数。销售表部分数据如下: OrderID Customer SellerId OrderDate ..
-
求每支股票的最高收盘价那一天,与前一日相比交易量的涨幅是多少。股市部分数据如下: DATE CODE NAME CLOSE OPEN AMOUNT 2020/01/02 000001 SS 3 ..
-
有分类产品销售额汇总表如下,请找出销售额大于所在分类平均销售额的产品: CategoryName ProductName ProductSales Beverages C?te de Blay ..