Z-score 方法

 

可能的异常值:|z|>2

高度可疑异常值:|z|>3

..

使用Z-score方法对Fare变量检测异常值


A
1 =file("D://titanic.csv").import@qtc()
2 =A1.avg(Fare)
3 =sqrt(var@s(A1.(Fare)))
4 =A1.derive((Fare-A2)/A3:Fare_z)
5 =A4.select(Fare_z>3 || Fare_z<-3)

A2 计算Fare的平均值

A3 计算Fare的标准差

A4 计算Farez分数

A5 筛选出Fare变量|z|>3的样本