绝对中位差(MAD)
MAD 定义为,一元序列 Xi同其中位数偏差的绝对值的中位数
MAD=median(|Xi−median(X)|)
例如,使用MAD方法检测Fare变量的异常值,阈值取3.5
A | |
1 | =file("D://titanic.csv").import@qtc() |
2 | =A1.(Fare) |
3 | =A2.median() |
4 | =A2.(abs(~-A3)) |
5 | =A4.median()*1.4826 |
6 | =A4.(~/A5) |
7 | =A6.pselect@a(~>3.5) |
8 | =A1(A7) |
A3 计算变量Fare的中位数
A4 计算每个Fare值与中位数偏差的绝对值
A5 计算偏差的中位数*1.4826得到MAD值
A6 计算每个偏差和MAD的比
A7 筛选出比值大于3.5的样本序号
A8 筛选出异常样本