图书 •
828 引用 •
203 回帖 •
3 关注
博客
关注
-
对于时间序列来说,比较两个时间序列的相似性是一个很普遍的任务。通俗来说,两个时间序列的数据越接近,它们的图像“长得越像”,两个时间序列就越相似,而形容它们“长得像”的程度就是相似度,用sm表示 ..
-
时间序列中,如果某一时段内的数据变化不大,我们称之为稳定段;某一时段内数据快速上升或者下降,我们称之为不稳定段;不稳定段通常是前一段稳定段的结束,也是后一段稳定段的开始,发现不稳定段可以确定每 ..
-
我们已经实现发现单形状曲线段的方法,有时我们还需要发现两种形状甚至更多形状连续出现的复合形状,比如先下降再平稳、先上升再平稳再下降等等。 还以之前的时间序列为例,找出先下降再平稳的曲线段。下图 ..
-
1. 筛选取值在[90,95]之间的曲线段 不需要计算特征指数,也不用投射参数。 参数设置: 特征指数名组合Nm Nm=[“Value”] 取值范围记Ag Ag=[[90,95]] 形状长度范 ..
-
有了前面的准备工作,我们就可以实现形状发现任务了。 先设定参数: 特征指数名组合记为Nm Nm=[f1,f2,…,fm] 其中fi是第i个特征指数名。 特征指数组合对应的取值范围记为Ag。 A ..
-
利用时间序列X计算出相关的特征指数,组成序表T: X f(1) f(2) … x1 f(1)1 f(2)1 … x2 f(1)2 f(2)2 … … … … … xn f(1)n f(2)n ..
-
时间序列X: X= [x1,x2,…,xn] 特征指数是表征时间序列走势的原子化特征,数学方法有无数种,本着奥卡姆剃刀原理,即用简单的方法能解决的问题就不复杂化。这里要介绍的特征指数的计算方法 ..
-
时间序列的走势在一定程度上能反应实际生产状况,比如走势平稳的曲线是正常情况,快速上升或者下降意味着生产状况不稳定,可能有异常情况发生。平稳、上升、下降在时间序列走势图中表现为某种形状,从历史数 ..
-
多维空间中的点可能是“聚集”的,也可能是散布在空间中的,怎么衡量空间中点分布的“离散程度”呢? [图片][图片] 观察这两幅图,第一幅图有明显的聚集效应,多数点“聚集”在下方,少数点散布在上方 ..
-
单维度异常发现算法能够得到单个时间序列的报警强度,通过某种方法对多个维度的报警强度进行“聚合”,就能得到多维时间序列的报警强度。我们仍然介绍简单朴素的方法来完成“聚合”,那就是对各维度加权平均 ..
-
上一节中介绍的异常发现方法是将“聚集”在一起的点视为常见点,“分散”的点视为异常点,“聚集”通常是无规则的,只要在多维空间中距离近的点就算“聚集”。不过,有时我们会发现某些场景的“聚集”会有强 ..
-
4.2.1 数据标准化 多维时间序列中各维度的量纲可能不同,计算距离前需要将各维度标准化到同样的量纲条件下,这种将不同量纲的数据转换成统一量纲的数据转换方法称为数据标准化。统计学有很多种数据标 ..
-
工业生产中,可能会有两个或者多个仪表协同工作的情况,如温度和压力,阀门开度和流量等。把多个时间序列形成的序列称为多维时间序列,用矩阵X表示。 [图片] X是m维时间序列,它的第i行是m个时间序 ..
-
原值、变化率、离散度等衍生序列都可以用来发现异常,相应的可以得到报警强度序列,将这些报警强度序列通过某种方式整合起来,使其能够表征最终的报警激烈强度,整合后的报警强度序列称为综合报警强度,用W ..
-
线性、指数、对数、三角函数,这几类衰减函数都有各自的特点,详见下表: [图片]
-
三角衰减函数是指权重随时间呈三角函数衰减,衰减后的权重序列记为Wci。 wcj=[-cos((j-1)*π/k’)/2+0.5]/s s=sum(-cos((j-1)*π/k’)/2+0.5) ..
-
对数衰减函数是指权重随时间呈对数衰减,衰减后的权重序列记为Wgi。 wgj=log(j,k’+1)/s s=sum(log(j,k’+1)) 其中Wgi是Rg[-(k’+1)]i+1的权重序列 ..
-
指数衰减函数是指权重随时间呈指数衰减,衰减后的权重序列记为Wei。 wej=bj-1-k’/s s=sum(bj-1-k’) 其中Wei是Rg[-(k’+1)]i+1的权重序列,b是底数,we ..
-
线性衰减函数是指权重随时间呈线性衰减,衰减后的权重序列记为Wli。 wlj=[(1/k’)*j-1/k’]/s s=sum((1/k’)*j-1/k’) 其中Wli是Rg[-(k’+1)]i+ ..
-
工业生产中,发现异常并不是最终目的,根据异常程度实现报警,提示操作人员完成相应的操作,提高生产效率或者生产安全性才是目的。之前介绍的“异常度”只能描述某个时刻的异常程度,还不具备用来报警的功能 ..
-
波动频率是描述原值波动次数的衍生序列。 通俗的讲,原值每改变一次趋势方向就算是波动一次,即原值每穿越一次主线就算波动一次,波动频率就是统计一段时间内原值穿越主线的次数,即统计波动序列Wv [- ..
-
波动幅度是描述原值波动大小的衍生序列。 通俗的讲,一段时间内最大值与最小值之差就可以作为波动幅度W。 wi=ma-mi 其中ma和mi是X[-l]i内的最大值和最小值。 但这么做会有隐患,当X ..
-
原值的波动可能比较频繁,但整体上呈现某一种趋势,主线就是描述这种趋势的衍生序列。 通俗的讲,将原值平滑后就可以描述原值的趋势。平滑化最常见的手段的就是平均,具体到时间序列就是移动平均。 时间序 ..
-
离散度是描述原值分布情况的衍生序列。 在统计学上经常使用方差来衡量一组数的离散程度,我们也可以延用方差来计算离散度,称为方差方法。 时间序列X的离散度序列S: si=sum((xj-a)2)/ ..
-
变化率是描述原值变化快慢的衍生序列。 通俗地看,变化率可以简单地用时间序列原值在单位时间内的变化差值来表示,变化率C可以这样计算: ci=(xi-xi-l)/l 当l=1时就是原值的差分序列, ..