缺失值分析
计算泰坦尼克数据中各变量缺失的数量和缺失率
A |
|
1 |
=file("D://titanic.csv").import@qtc() |
2 |
=A1.fname() |
3 |
=A2.((y=~,A1.align@a([true,false],!eval(y)))) |
4 |
=A2.new(~:col,A3(#)(1).len():null_no,round(null_no/A1.len(),3):null_rate) |
A2 取字段名
A3 将A1表中的各变量按照是否缺失分为两组
A4 统计A3每个成员的缺失组的数量和占比,得到每个变量的缺失数和缺失率