Z-score 方法

 

可能的异常值:|z|>2

高度可疑异常值:|z|>3

..

使用Z-score方法对Fare变量检测异常值


A

1

=file("D://titanic.csv").import@qtc()

2

=A1.avg(Fare)

3

=sqrt(var@s(A1.(Fare)))

4

=A1.derive((Fare-A2)/A3:Fare_z)

5

=A4.select(Fare_z>3 || Fare_z<-3)

A2 计算Fare的平均值

A3 计算Fare的标准差

A4 计算Farez分数

A5 筛选出Fare变量|z|>3的样本