图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
除上述几个简单的计算指标外,通常还会用AUC,GINI,KS来评价模型的整体表现 还是使用上一小节泰坦尼克的预测数据titanic_export.csv,用到的变量有Survived_1_pe ..
-
多空布林线(BBIBOLL)是以多空线为中心线,多空线的标准差为带宽的轨道线。UPR 线为压力线, 对股价有压制作用,DWN 线为支撑线, 对股价具有支撑作用,BBIBOLL 线为中轴线。 计 ..
-
过抽样是通过增加样本中小类样本的数据量来实现样本均衡。其中较为简单的方式是直接复制小类样本,形成数量上的均衡。 对泰坦尼克样本数据过抽样如下: A 1 =file('D://titanic.c ..
-
将 3 个表的数据关联连接,生成新序表后分组汇总。 根据相互关联的员工收入表、订单表和订单明细表,为单笔订单的实际金额超过 1000 的销售人员,给予订单金额 5% 的业绩奖励。 [图片] 使 ..
-
有日销售统计表如下所示,请算出日销售额超过 1000 的天数。 Date Sales 2022-01-01 00:00:00 98.0000 2022-01-02 00:00:00 174.0 ..
-
有数据如下: [图片] 把它转变成行式列表,如下图所示: [图片] 代码如下: =spl('=E(?1).pivot@r(Names,Sales;Weekday,Day).new(Names, ..
-
变量交互是指两个变量相乘,可以是数值变量*数值变量,也可以是分类变量*分类变量。 组合特征是特征工程中非常重要的方法之一,它将两个或更多的类别属性组合成一个。当组合的特征要比单个特征更好时,这 ..
-
列出两个日期之间的工作日序列。 列出从 2020/04/27 到 2020/05/08 区间内每个工作日值班的人员名称。考勤表部分内容如下: ID Date Name 1 2020/04/27 ..
-
计算学生的数学成绩在班里的排名: Class Name Maths 1 Tom 85 2 John 92 2 Joan 86 1 Rocky 95 2 Ham 92 1 Kate 83 1 R ..
-
当矩阵为方阵时可计算行列式,使用det(A)函数 A 1 [[3,5],[2,8]] 2 =det(A1) A2 计算A1的行列式,返回14
-
在序列的聚合运算中,计算和列。 订单表和订单明细表是主子表关系,每个订单有多条明细数据。如下图: Order ID* Customer Date OrderDetail OrderID* Nu ..
-
有数据如下所示: [图片] 将 M 列的二维表转置为 M 行,要求从第 M 列开始转,依次为 M-1,M-2…2,1 列, 结果如下: [图片] 代码如下: =spl('=transpose( ..
-
原值的波动可能比较频繁,但整体上呈现某一种趋势,主线就是描述这种趋势的衍生序列。 通俗的讲,将原值平滑后就可以描述原值的趋势。平滑化最常见的手段的就是平均,具体到时间序列就是移动平均。 时间序 ..
-
动态行转列,是指转置时生成的字段不能事先指定,只能根据原字段的取值动态确定。 员工表如下: Name Dept Area Salary David Sales Beijing 8000 Dan ..
-
A 列和 B 列是自然数,分别代表数组的起点和终点: [图片] 用 A 列和 B 列生成自然数 数组 组成的字符串,并填入 C 列,如下: [图片] 在 C2 写入代码: =spl('=to( ..
-
训练集和测试集中0/1 类(目标变量)的比例接近一致 A 1 =file('D://titanic.csv').import@qtc() 2 =A1.group@p(Survived) 3 = ..
-
递归调用函数解决汉诺塔问题。 汉诺塔问题是递归的经典问题。把 A 杆上的圆盘全部移到 C 杆上,并仍保持原有顺序叠好。每次移动一个圆盘,移动时要始终保持大盘在下,小盘在上。 [图片] 盘子从小 ..
-
对数变换一般用于金融数据,可以把指数增长型的数据转化为线性增长 例如: A 1 =[1.26,1.58,2,2.51,3.16,3.98,5.01,6.31,7.94,10] 2 =A1.(l ..
-
将序列中的成员连成一串,连接时成员加引号。 查询每个部门的员工分布在哪些州,州名称用空格分隔。因为有的州名本身就有空格,所以要加引号区别。员工表如下: ID NAME SURNAME STAT ..
-
[图片]将矩阵进行上下合并和左右合并 A B 1 [[3,5],[2,8]] [[4,6],[2,4]] 2 =A1|B1 3 =transpose([A1,B1]).(~.conj()) A ..
-
有产品类别表如下,其中 ID 字段是主键,需找出 ID 字段值分别为 5,7,10 的成员序号: Category ID Name Description … 脚本: A 1 =connect ..
-
定位赋值行转列,动态生成新序表数据结构,最后根据行列位置直接赋值。 根据用户记录,动态生成用户列,统计用户每周在线情况。根据相互关联的用户表和记录表中,汇总统计 2018 年每周用户的活动情况 ..
-
有如下产品日销售额表: OrderDate ProductName Sales 1996-07-04 Aniseed Syrup 51919.0000 1996-07-04 Chai 2116 ..
-
有数据如下: [图片] 在 D 列算出当前学生 TotalScore 的排名(从大到小),在 D2 中写入: =spl('=?1.conj().rank@z(?2)',C$2:C$12,C2) ..
-
数据中远离其他点的数据是不常见数据,比较数据中的每个点与其他所有点的距离(绝对差)之和,以最小距离和作为基准,超过该基准一定倍数的点就是异常值。 找出距离其他点都“不远”的数据,可以认为这些是 ..