分类变量平滑化
使用A.smooth(T)或P.smooth(cn, T)函数,可以将变量做平滑化处理,经过平滑化处理后可以消除映射成整数后数值大小的影响。
例如还是上一小节中的“Ticket”变量,对其做平滑化处理:
A |
|
1 |
=file("D://titanic.csv").import@qtc() |
2 |
=file("D://titanic_t.csv").import@qtc() |
3 |
=A1.smooth@ic("Ticket",A1.(Survived)) |
4 |
=A2.smooth@rc("Ticket",A3(2)) |
A1 导入建模数据
A2 导入预测数据
A3使用P.smooth(cn, T)函数对变量“Ticket”做平滑化处理,返回平滑结果和平滑记录Rec
A4根据A3的平滑化记录,在预测集上做平滑化处理。