-
残差residual=真实值-预测值 计算houseprice_result.xls中的残差并画图 A 1 =T('houseprice_result.xls') 2 =A1.derive(S ..
-
在建模数据中经常遇到这样一种变量,其本身是受因变量影响的(即它不但不是因变量的影响因素,反而因变量是它的影响因素),若该变量被作为自变量添加入模型,则会造成其他自变量不能进入模型。同时,由于这 ..
-
报表开发中时常会遇到需要对参数赋初始值对报表进行初始加载查询的情况。下面我们分别举例说明一下 初始值为固定数值 如下图报表参数模板使用的编辑风格为编辑框, 初始加载因参数值为空 顾主表部分空白 ..
-
数据库中实际执行人那列存的是人员 ID,多个执行人用逗号分隔。(见下图) 现在需求是实际执行人那列需要展示人员名字,多个执行人用逗号分隔(即把 ID 替换为名字)。请问这种情况用 SPL 如何 ..
-
使用统计假设检验的方法也可以判断自变量对因变量的影响是否显著,在SPL中提供了几种统计检验p值计算的函数,可以根据数据情况选择合适的检验形式,函数用法见p 值 - 乾学院 (raqsoft.c ..
-
相关系数是度量两个变量之间相关程度的统计量,常用的有Pearson相关系数和Spearman相关系数,两者值均在[-1,1]之间分布,当其值为0时两个变量不想关,当其值为1或-1时,表示两个变 ..
-
有边界的线性拟合方法保证拟合时收率被限制在边界内,误差限制法保证收率不偏离基础收率太远,现在只有约束2(所有出料对某一种进料的收率和等于1)还没有满足,本节将介绍一种线性变换的方法来满足此约束 ..
-
为了满足约束3(收率不能偏离基础收率太远),将收率与基础收率的差称为偏差收率,记为WE。 WE=W-B 收率W范围是[0,1],基础收率B是固定的,偏差收率WE的理论最大范围是[-1,1],但 ..
-
在积累了一些进料和出料的样本数据后,我们希望计算出收率矩阵。 如果没有任何约束条件,用最小二乘法就可以得到收率W。 W=linefit(X,Y) 其中linefit(…)是最小二乘线性拟合函数 ..
-
工业生产活动的目标是利用原料生产产品,从而产生利润。原料经过一系列加工过程,包括物理反应和化学反应,最终形成产品,生产的理想状态是原料到产品的转换率是确定的,工厂想生产多少产品就知道需要准备多 ..
-
单元格 A1 里是一个表格,我在单元格 A3 里使用 $select * from {A1.import@t()} where Material = ‘DC02C010C00’ 可以查询出图中 ..
-
对于时间序列来说,比较两个时间序列的相似性是一个很普遍的任务。通俗来说,两个时间序列的数据越接近,它们的图像“长得越像”,两个时间序列就越相似,而形容它们“长得像”的程度就是相似度,用sm表示 ..
-
一、问题提出 时间序列数据主要由电力行业、化工行业、气象行业、地理信息等各类型实时监测、检查与分析设备所采集、产生的数据,这些工业数据的典型特点是:产生频率快(每一个监测点一秒钟内可产生多条数 ..
-
时间序列中,如果某一时段内的数据变化不大,我们称之为稳定段;某一时段内数据快速上升或者下降,我们称之为不稳定段;不稳定段通常是前一段稳定段的结束,也是后一段稳定段的开始,发现不稳定段可以确定每 ..
-
RT,看文档似乎这两个是等效的,但结果却不同,想请教一下原因。 [图片] [图片] [图片]
-
-
我们已经实现发现单形状曲线段的方法,有时我们还需要发现两种形状甚至更多形状连续出现的复合形状,比如先下降再平稳、先上升再平稳再下降等等。 还以之前的时间序列为例,找出先下降再平稳的曲线段。下图 ..
-
1. 筛选取值在[90,95]之间的曲线段 不需要计算特征指数,也不用投射参数。 参数设置: 特征指数名组合Nm Nm=[“Value”] 取值范围记Ag Ag=[[90,95]] 形状长度范 ..
-
测试用例如下图: [图片] 注意事项: (1)fork 40 个线程; (2)每个线程运行 100 次; (3)数据库测试表数据在 1w 以上; (4)mongo_shell 指定返回游标; ..
-
有了前面的准备工作,我们就可以实现形状发现任务了。 先设定参数: 特征指数名组合记为Nm Nm=[f1,f2,…,fm] 其中fi是第i个特征指数名。 特征指数组合对应的取值范围记为Ag。 A ..
-
利用时间序列X计算出相关的特征指数,组成序表T: X f(1) f(2) … x1 f(1)1 f(2)1 … x2 f(1)2 f(2)2 … … … … … xn f(1)n f(2)n ..
-
时间序列X: X= [x1,x2,…,xn] 特征指数是表征时间序列走势的原子化特征,数学方法有无数种,本着奥卡姆剃刀原理,即用简单的方法能解决的问题就不复杂化。这里要介绍的特征指数的计算方法 ..
-
时间序列的走势在一定程度上能反应实际生产状况,比如走势平稳的曲线是正常情况,快速上升或者下降意味着生产状况不稳定,可能有异常情况发生。平稳、上升、下降在时间序列走势图中表现为某种形状,从历史数 ..
-
多维空间中的点可能是“聚集”的,也可能是散布在空间中的,怎么衡量空间中点分布的“离散程度”呢? [图片][图片] 观察这两幅图,第一幅图有明显的聚集效应,多数点“聚集”在下方,少数点散布在上方 ..
-
单维度异常发现算法能够得到单个时间序列的报警强度,通过某种方法对多个维度的报警强度进行“聚合”,就能得到多维时间序列的报警强度。我们仍然介绍简单朴素的方法来完成“聚合”,那就是对各维度加权平均 ..