图书 •
860 引用 •
253 回帖 •
4 关注
博客
关注
-
当分类变量的分类数较多时,可能会存在一些频数极小的类别,例如极少数分类,异常分类,疑似错误分类等情况,这时可以通过合并低频变量来降低分类个数。 例如Titanic.csv中的“Name”是一个 ..
-
代码: =spl('=periods@mox(''2018-03-31'',''2019-03-01'',1)') 说明:生成 2018-03-31 到 2019-03-01 之间间隔 1 月 ..
-
[图片] 问题 八皇后问题是一个古老而著名的问题。具体为:在 8X8 格的国际象棋上摆放八个皇后,使其不能互相攻击,即任意两个皇后都不能处于同一行、同一列或同一斜线上,请问有多少种摆法。 思路 ..
-
纠偏,就是通过各种数学转换,使得变量的分布呈现或者近似正态分布,模型的拟合常常会有明显的提升。 常用的数学变换有:对数变换、幂变换(例如开根号、平方等)、倒数变换、指数变换、rank 变换等 ..
-
循环计算迭代求和的结果。 根据上证指数表,计算 2019 年每个交易日的全年累计成交金额。上证指数表部分数据如下: Date Open Close Amount 2019/12/31 3036 ..
-
数据 1: [图片] 代码 1-1: =spl('=?1.property()',A1) 函数 property 从 KV 串中读取属性值,参数省略时返回所有属性形成序表 结果 1-1: [图 ..
-
计算两个日期时间数据相差的天数。 查询 2015 年发货时间超过 30 天的订单。订单表如下: ID CustomerID OrderDate DeliveryDate Amount 1024 ..
-
比较两个序列中各个位置的成员是否全部相等。 下面是随机抽样后生成的文件,比较两次随机抽样是否选出了相同的序号。文件部分数据如下: ID Predicted_Y Original_Y 10 0. ..
-
A.comreal()可获得复数的实部 A.comimage()可获得复数的虚部 A 1 =[[1,2],[3,4],[5,6],[7,8],[5,0],[-5,0],[-8,-9],[-0. ..
-
例如,还是titanic.csv中的”Fare”变量,分别以3倍标准差(z=3)和5倍标准差为标准(z=5)对异常值进行标注。 A 1 =file('D://titanic.csv').imp ..
-
在两个关联的表中,根据多字段关联条件筛选记录后,分组汇总。 根据相互关联的分数表和学生资料表,查询一班每个学生的各科总分。 [图片] 使用 A.join() 函数的 @i 选项,删除不匹配的记 ..
-
在一个表中,根据集合的包含性判断查找记录。 在员工表中,统计一线城市各部门的平均工资。 ID NAME CITY SALARY 1 Rebecca Tianjin 7000 2 Ashley ..
-
将标准 SQL 语句翻译成指定数据库所使用的格式。 某公司的销售数据,部分存储在数据库 oracle 中,部分存储在数据库 mysql 中。求 2015 年 3 月 18 日到 7 月 18 ..
-
把变量值按照从小到大的顺序排列,根据数据集样本个数等分为k 部分,每部分当作一个分箱,比如分箱数是 10,则每个箱内包含大约 10% 的样本量。 将”Fare”变量等频分箱 A 1 =file ..
-
相互关联的表,通过多字段主键左连接筛选记录。 根据相互关联的产品表、订单明细表和订单回款表,查询 2014 年有回款记录,且单笔订单金额超过 500 的产品名称。 [图片] 使用 A.join ..
-
有数据如下: [图片] 按 Class 分组,算每个 Class 的各科成绩的平均分: =spl('=E(?1).groups(Class;avg(Maths):Maths,avg(Engli ..
-
递归调用函数解决海盗分金问题。 海盗分金问题: 5 个海盗抢得 100 枚金币,他们按抽签的顺序依次提方案:首先由 1 号提出分配方案,然后 5 人表决,投票要超过半数同意方案才被通过,否则他 ..
-
过去 N 日, 股票相对行业指数的收益波动率, 相对收益波动率越大, 股票相对行业指数越容易走出不同走势。 相对行业波动率 =(股票涨幅 - 行业涨幅)的 N 日标准差 * sqrt(N 日) ..
-
两个相互关联的表,通过全连接跨表计算。 根据相互关联的销售表和产品表,比较 2014 年每个月的产品销售情况。 [图片] 使用 join() 函数的 @f 选项进行全连接。 脚本: A 1 = ..
-
无论是数据分析还是数据挖掘,首先都会浏览数据,查看一下数据的基本情况 SPL提供交互式的操作界面,这对数据分析用户来说非常友好。 比如泰坦尼克的数据,使用SPL进行查看代码如下: A 1 =f ..
-
有数据如下: [图片] [图片] 用 Sheet1 中每行的 M,N,O 的值对应 Sheet2 中的 M,N,O 的值去查找,然后返回此行的 House 值填在 Sheet1 的 E 列中, ..
-
使用“?”或“=”作为分隔符,将字符串分别拆分为两个字符串。 在某网站记载了用户访问的 URL,要查询使用频率最高的搜索条件。部分内容如下: ID User Website 1 Rebecca ..
-
使用kmeans()可以将样本按照指定的类数,进行聚类。目前SPL中的聚类数暂且只支持2。 例如,有一组样本[[1,2,3,4],[2,3,1,2],[1,1,1,-1],[1,0,-2,-6 ..
-
根据成绩表,求前两名的学生分数是多少。 STUDENTID SCORE 1 84 2 77 3 69 4 81 5 80 … … 脚本: A 1 =connect(“db”) 2 =A1.qu ..
-
有 Base64 编码串:eyJhIjo2MywiYyI6Mjk4LCJuIjoxLCJzIjoxLCJlIjo0MCwicCI6NH0= 需要将其转码后的 json 串({“a”:63,“c ..