绝对中位差(MAD)

 

MAD 定义为,一元序列 Xi同其中位数偏差的绝对值的中位数

MAD=median(|Xi−median(X)|)

例如,使用MAD方法检测Fare变量的异常值,阈值取3.5


A

1

=file("D://titanic.csv").import@qtc()

2

=A1.(Fare)

3

=A2.median()

4

=A2.(abs(~-A3))

5

=A4.median()*1.4826

6

=A4.(~/A5)

7

=A6.pselect@a(~>3.5)

8

=A1(A7)

A3 计算变量Fare的中位数

A4 计算每个Fare值与中位数偏差的绝对值

A5 计算偏差的中位数*1.4826得到MAD

A6 计算每个偏差和MAD的比

A7 筛选出比值大于3.5的样本序号

A8 筛选出异常样本