缺失值分析
计算泰坦尼克数据中各变量缺失的数量和缺失率
A | |
1 | =file("D://titanic.csv").import@qtc() |
2 | =A1.fname() |
3 | =A2.((y=~,A1.align@a([true,false],!eval(y)))) |
4 | =A2.new(~:col,A3(#)(1).len():null_no,round(null_no/A1.len(),3):null_rate) |
A2 取字段名
A3 将A1表中的各变量按照是否缺失分为两组
A4 统计A3每个成员的缺失组的数量和占比,得到每个变量的缺失数和缺失率