2.1 衍生时间序列发现异常
再回顾观察这张图,之前介绍过,(d)中的异常情况无法通过考虑时间序列取值是否异常的方法发现,但显然这个(d)中是有异常的,那么又该如何发现呢?
分析(d)的情况,异常原因是因为变化过快,我们来看看“变化快慢”是否能用来发现异常。
上图中左纵轴是序列X的值,右纵轴是“变化快慢”的值,图中X是原序列曲线,C是“变化快慢”曲线。观察后可以发现,用之前介绍的异常发现方法对C来做就可以发现异常了。(说明:序列X开始的几个点无法计算“变化快慢”,所以上图中的点数少于图2.1(d)中的点数。)
把时间序列X称为原值,由它衍生出来的数据(如“变化快慢”)称为衍生序列,记为X’。
X’= F(X)
其中X’的第i个元素x’i通常只和xi前一段数据有关,即:
x’i= f(X[-(l+1)]i+1)
其中f(…)是某种数学变化的方法,X[-(l+1)]i+1是xi与它之前一个区间的数据X[-l]i构成的序列,前l个原值没有对应的x’i。
很多情况下基于原值用前述的衡量异常度的方法无法发现的异常,转换成衍生序列就可能发现了。
当然衍生序列不只有“变化快慢”,还有很多其他能描述原值特征的序列。本章就来介绍一些常用衍生序列的计算方法。