Z-score 方法
可能的异常值:|z|>2
高度可疑异常值:|z|>3
使用Z-score方法对Fare变量检测异常值
A | |
1 | =file("D://titanic.csv").import@qtc() |
2 | =A1.avg(Fare) |
3 | =sqrt(var@s(A1.(Fare))) |
4 | =A1.derive((Fare-A2)/A3:Fare_z) |
5 | =A4.select(Fare_z>3 || Fare_z<-3) |
A2 计算Fare的平均值
A3 计算Fare的标准差
A4 计算Fare的z分数
A5 筛选出Fare变量|z|>3的样本