图书 •
851 引用 •
238 回帖 •
4 关注
博客
关注
-
除上述几个简单的计算指标外,通常还会用AUC,GINI,KS来评价模型的整体表现 还是使用上一小节泰坦尼克的预测数据titanic_export.csv,用到的变量有Survived_1_pe ..
-
两个关联的表,将相关联的数据合并计算,两个表不一定完全匹配。 根据相互关联的员工薪资表和津贴表,求员工的总收入。 [图片] 使用 A.switch() 函数将外键字段转成外键表中对应记录,对应 ..
-
我们可以使用相对位置的区间,来引用相邻记录组成的序列。 列出上证指数 2020 年 1 月 1 日至 10 日每天的 20 日收盘均价。上证指数部分数据如下: DATE CLOSE OPEN ..
-
A.numnorm()和P.numnorm(cn)可以对数值型变量执行标准化处理。 例如房价预测数据中的变量”LotArea”量纲比较大,对其进行归一化 A 1 =T('D://house_p ..
-
N 日成交量:N 日成交股数 成交量均线,N 日成交量的均值即成交量 N 日 MA 值 以代码 600000 的股票数据为例,计算其成交量的 5 日 MA 值 A 1 5 2 = T(“ D: ..
-
工业生产活动的目标是利用原料生产产品,从而产生利润。原料经过一系列加工过程,包括物理反应和化学反应,最终形成产品,生产的理想状态是原料到产品的转换率是确定的,工厂想生产多少产品就知道需要准备多 ..
-
在结构相同的两个表中,根据字段值将其中的记录有序归并,并去掉重复记录。 某商家根据销售渠道不同,销售记录分别存储在线上和实体店两个表。有时线上线下同时搞活动,部分销售记录被同时存储在两个表中。 ..
-
代码: =spl('=periods(date(''2020-01-01'',''yyyy-MM-dd''),date(''2020-01-10'',''yyyy-MM-dd''),2)') ..
-
有如下交叉表数据,列方向是产品规格的宽度,行方向是长度: [图片] 现在想要把数据变成行式列表,规格显示为宽度 * 长度,如下图所示: [图片] 代码如下: =spl('=E(?1).pivo ..
-
对数变换一般用于金融数据,可以把指数增长型的数据转化为线性增长 例如: A 1 =[1.26,1.58,2,2.51,3.16,3.98,5.01,6.31,7.94,10] 2 =A1.(l ..
-
列出两个日期之间的日期序列。 重叠部分不重复计数时,求多个时间段包含的总天数。部分数据如下: ID Start End 1 2012/07/04 2012/07/16 2 2012/07/06 ..
-
有数据库表 TBLORDERS,数据如下所示: ORDERNUMBER STEP1_STATUS STEP1_START STEP1_END STEP2_STATUS STEP2_START ..
-
对于多项式拟合,SPL提供了现成的函数polyfit() 例如还是上一小节中的数据,我们采用[图片]的形式拟合 A …… …… 14 =polyfit(A1,A2,2).conj() 15 = ..
-
代码: =spl('=periods(date(''2020-01-01'',''yyyy-MM-dd''),date(''2020-01-10'',''yyyy-MM-dd''),1)') ..
-
如下数据中有序存放着多种部件及其金属子部件,当 Level=2 时,表示该行为部件(汇总行),当 Level=3 时,表示该行为子部件。Material 列和 Proportion 列分别存放 ..
-
问题 此问题的目的是用文本模拟出直方图。 下图是员工信息表,其中 DEPTNO 为员工所在的部门。 EMPNO ENAME DEPTNO 7934 Miller 10 7782 Clark 1 ..
-
异常值的处理方法: 删除含有异常值的记录:直接将含有异常值的记录删除; 视为缺失值:将异常值视为缺失值,利用缺失值处理的方法进行处理; 修正异常值:可用端点值或前后两个观测值的平均值修正该异常 ..
-
在结构相同的两个表中,根据字段值将其中的记录有序归并,只保留非重复记录。 比较两次随机抽样文件,列出其中不同的序号。 ID Predicted_Y Original_Y 10 0.012388 ..
-
问题 某 B2C 网站需要计算订单的邮寄费用,大部分情况下,邮费有包裹的总重量决定,但是,当订单的价格超过 300 美元时,提供免费付运。详细规则如下面的 mailCharge 表所示: fi ..
-
列出两个日期之间的工作日序列。 列出从 2020/04/27 到 2020/05/08 区间内每个工作日值班的人员名称。考勤表部分内容如下: ID Date Name 1 2020/04/27 ..
-
等距分箱:将变量的取值范围分为k 个等宽的区间,每个区间当作一个分箱,这里只考虑边界,每个箱内的样本量可能不等。 例如,将”Fare”变量等距分箱 A 1 =file('D://titanic ..
-
有日销售统计表如下所示,请算出日销售额超过 1000 的天数。 Date Sales 2022-01-01 00:00:00 98.0000 2022-01-02 00:00:00 174.0 ..
-
有学生考场及座位的明细数据,部分数据如下: [图片] 每 13 行后补两条空行。结果如下: [图片] 代码如下: A 1 =E(‘A1:D152’) 2 =row=A1.create().in ..
-
例如在泰坦尼克的数据中,”Embarked”字段有两个缺失值,直接删除缺失的样本 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.select( ..
-
以下数据从第 2 列开始,每两列是一对(即除第 1 列之外的偶数列和奇数列,比如第 2 列和第 3 列),这样的列共 4 对: [图片] 按照第 1 列、所有的偶数列分组,组内对奇数列汇总。结 ..