寻找用于数据准备的工具

【问题】

Predictive Analytics: What tools do you use for Data Preparation, primarily for outlier detection and removal, Feature Selection etc. If you use R software, what packages do you use?

【回答】

用集算器准备,有许多结构化运算的函数,可以方便地准备出有关联的数据,也可以写出巨大的数据。可参考【离线自由计算】。

R处理结构化数据的方法不太好用,而且性能实在太差了,对大文件的支持也不好。