图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
无论使用上述哪种方法,阈值上限tu、阈值下限td都是学习区间中的某一个数,这就会有一个问题,当xi大于其中的最大值或小于最小值时,xi就一定会被认为是异常。 有时我们希望当xi超限不多时,不认 ..
-
相互关联的表,通过多字段主键左连接筛选记录。 根据相互关联的产品表、订单明细表和订单回款表,查询 2014 年有回款记录,且单笔订单金额超过 500 的产品名称。 [图片] 使用 A.join ..
-
根据成绩表,求前两名的学生分数是多少。 STUDENTID SCORE 1 84 2 77 3 69 4 81 5 80 … … 脚本: A 1 =connect(“db”) 2 =A1.qu ..
-
有月销售额排名前五的产品销售数据如下: [图片] 请选出重复出现三次及以上的产品数据: =spl('=E(?1).group(ProductName).select(~.len()>2) ..
-
循环中使用迭代计算,自行设置迭代中的计算表达式和终止条件。 根据销售表数据,统计 2014 年第一季度到哪一天完成了销售总额 15 万的季度目标。 OrderID Customer Selle ..
-
β系数,是一种风险指数,用来衡量个别股票或股票基金相对于整个股市的价格波动情况,例如某支股价在过去 12 个月相对沪深 300 波动敏感度。 Beta>1,股票对沪深 300 的敏感度高 ..
-
例如,还是titanic.csv中的”Fare”变量,分别以3倍标准差(z=3)和5倍标准差为标准(z=5)对异常值进行标注。 A 1 =file('D://titanic.csv').imp ..
-
当分类变量的分类数较多时,可能会存在一些频数极小的类别,例如极少数分类,异常分类,疑似错误分类等情况,这时可以通过合并低频变量来降低分类个数。 例如Titanic.csv中的“Name”是一个 ..
-
解析 HTML 文件,读出序表。 从 HTML 文件中解析出成绩表,并统计每个学生的总分。 … CLASSSTUDENTIDSUBJECTSCORE Class one1Math77 Cl ..
-
CCI 指标是美国股市技术分析家唐纳德·蓝伯特 (Donald Lambert) 于 20 世纪 80 年代提出的,专门测量股价、外汇或者贵金属交易是否已超出常态分布范围。波动于正无穷大和负无 ..
-
有数据如下: [图片] 按 ID 的前两位分组汇总,计算总销售额: =spl('=E(?1).groups(left(ID,2):ID;sum(Sales):Sales)',A1:C25) [ ..
-
有今年前几个月的销售额排名前十的产品列表 (随着时间的推移,月数会增加): [图片] 找出这几个月全部进了前十的产品名单: =spl('=transpose(?1).isect()',B2:E ..
-
有年季度销售数据如下: [图片] A 列有序,且有重复值,现在要将同类数据非首行清空: =spl('=E(?1).group(#1).(~.run(if(#==1,,#1=null))).co ..
-
连续型数据属于定量数据,对于定量数据通常可以从集中趋势测度、分散测度、相对位置测度和对称性测度四个维度来分析。 [图片] 例如泰坦尼克数据中有一个连续型变量”Age”,表示乘客的年龄,探索代码 ..
-
使用序列字段连接,计算叉积来生成新序表。 根据任课教师表和课程表,查询每个可能能够安排的老师名字。 Teachers: Teacher Branch Courses Petitti Matem ..
-
问题 某企业打算给企业内的夫妻员工提供廉价购房福利,此福利只对夫妻都在企业内的家庭提供,且条件之一是夫妻的年龄和达到或超过 70 岁。下面是企业的员工信息表: [图片] 下面是职工关系表,记录 ..
-
有数据如下: [图片] 在 B 列计算当前行成员的排名 (从大到小),在 B1 中写入: =spl('=?1.conj().rank@z(?2)',A$1:A$10,A1) [图片] 把 B1 ..
-
把变量值按照从小到大的顺序排列,根据数据集样本个数等分为k 部分,每部分当作一个分箱,比如分箱数是 10,则每个箱内包含大约 10% 的样本量。 将”Fare”变量等频分箱 A 1 =file ..
-
对于按照一定次序排列的数据进行计算,经常会遇到跨行引用的情况,比如股票价格相比前一天的涨幅是多少。 SPL 支持在循环计算时,通过相对位置进行相邻记录的引用。 求上证指数每天收盘价较前日上涨了 ..
-
比较两个序列中各个位置的成员是否全部相等。 下面是随机抽样后生成的文件,比较两次随机抽样是否选出了相同的序号。文件部分数据如下: ID Predicted_Y Original_Y 10 0. ..
-
有如下数据: [图片] 选出整行不重复的数据,重复出现的数据选出第一条: =spl('=E(?1).group@u(ID,Name,Gender,Birthday).(~(1))',A1:D7 ..
-
有日销售统计表如下所示,请算出每种产品日销售额超过 1000 的天数。 Date Product Sales 2022-01-01 00:00:00 Cereal 98.0000 2022-0 ..
-
震荡量指标 OSC,也叫变动速率线。属于超买超卖类指标。是从移动平均线原理派生出来的一种分析指标。它反应当日收盘价与一段时间内平均收盘价的差离值。从而测出股价的震荡幅度。按照移动平均线原理,根 ..
-
A.freq(o)计算向量A 中 o 出现的频度,如果 o 省略,则查找空值的频度(包括空字符串和 NA) A 1 [0,NA,2,3,,5,6,3,100,9] 2 =A1.freq(3) ..
-
有各年月用水量数据,只有每年的第 1 个月前填写了年份,部分数据如下所示: [图片] 计算各年用水量总和,在 D1 中填入公式: =spl('=E(?1).derive(:TotalWater ..