Z-score 方法
可能的异常值:|z|>2
高度可疑异常值:|z|>3
使用Z-score方法对Fare变量检测异常值
A |
|
1 |
=file("D://titanic.csv").import@qtc() |
2 |
=A1.avg(Fare) |
3 |
=sqrt(var@s(A1.(Fare))) |
4 |
=A1.derive((Fare-A2)/A3:Fare_z) |
5 |
=A4.select(Fare_z>3 || Fare_z<-3) |
A2 计算Fare的平均值
A3 计算Fare的标准差
A4 计算Fare的z分数
A5 筛选出Fare变量|z|>3的样本