绝对中位差(MAD)

 

MAD 定义为,一元序列 Xi同其中位数偏差的绝对值的中位数

MAD=median(|Xi−median(X)|)

例如,使用MAD方法检测Fare变量的异常值,阈值取3.5


A
1 =file("D://titanic.csv").import@qtc()
2 =A1.(Fare)
3 =A2.median()
4 =A2.(abs(~-A3))
5 =A4.median()*1.4826
6 =A4.(~/A5)
7 =A6.pselect@a(~>3.5)
8 =A1(A7)

A3 计算变量Fare的中位数

A4 计算每个Fare值与中位数偏差的绝对值

A5 计算偏差的中位数*1.4826得到MAD

A6 计算每个偏差和MAD的比

A7 筛选出比值大于3.5的样本序号

A8 筛选出异常样本