绝对中位差(MAD)
MAD 定义为,一元序列 Xi同其中位数偏差的绝对值的中位数
MAD=median(|Xi−median(X)|)
例如,使用MAD方法检测Fare变量的异常值,阈值取3.5
A |
|
1 |
=file("D://titanic.csv").import@qtc() |
2 |
=A1.(Fare) |
3 |
=A2.median() |
4 |
=A2.(abs(~-A3)) |
5 |
=A4.median()*1.4826 |
6 |
=A4.(~/A5) |
7 |
=A6.pselect@a(~>3.5) |
8 |
=A1(A7) |
A3 计算变量Fare的中位数
A4 计算每个Fare值与中位数偏差的绝对值
A5 计算偏差的中位数*1.4826得到MAD值
A6 计算每个偏差和MAD的比
A7 筛选出比值大于3.5的样本序号
A8 筛选出异常样本