几种自动建模产品使用体验
Ymodel,Weka和Rapidmine Studio(以下统一简称Rapidminer)是三款自动建模做的都不错的产品,在 Ymodel-Weka-Rapidminer 自动建模效果对比一文中,我们对三者的建模效果进行了测试,本文我们从用户使用体验的角度来对比一下。
产品概况
YModel是一款专门自动建模的软件,提供全自动化的建模体验。
Weka和Rapidminer是集手动建模和自动建模为一体的软件。本文的对比描述仅针对自动建模部分。
安装方法
Weka: AutoWEAK 为Weka的一个扩展包,需要先安装Weka然后在package manager里自行安装,安装过程可能会出现无法连接或安装失败的问题需要自己解决
YModel:专门的自动化建模软件,直接安装即可
Rapidminer:自动建模是Rapidminer的重要功能模块,直接安装软件即可
上手难度
YModel 是一个纯粹的自动建模工具,操作最简单,在主界面点击建模共功能后会弹出对话框一步一步引导用户导入数据,设置字符格式,配置目标变量等,用起来十分流畅,几乎不需要看文档。
其次Rapidminer,功能稍多,但自动建模部分用起来也不难,对着文档也能很快熟悉。
Weka的主界面提供几种不同的操作方式,比如菜单式操作,流程图式的操作,命令行操作,如果是初学者需要花些时间学习一下。自动建模在Weka里不是一个独立的功能,而是一个特殊的模型,因此操作和手工建模部分是混合在一起的,很多操作都需要用户去找。
建模自动化程度
三款软件都可以实现全自动化的数据预处理和建模过程,即使非专业人员也可以使用。建模效果也都不错,在不同的数据集上表现各有千秋,详情可阅 Ymodel-Weka-Rapidminer 自动建模效果对比。
就建模过程的自动化程度来讲,Ymodel和Rapidminer要好于AutoWeka。
比如会有一些的数据类型,AutoWeka识别不了,要在Weka里提前手动处理一下。Ymodel和Rapidminer做的就比较好,在测试的几组数据中没有出现识别不了的数据类型。
Ymodel和Rapidminer相比较而言二者各有特色。
Ymodel是一款专门的自动化建模软件,全过程的自动化做的更为极致。比如导入数据时,YModel会自动分析变量,计算很多统计指标,生成变量分布图,计算和目标变量之间的相关性,剔除无用变量等。基本上分析变量常用的指标都给计算好了。
Rapidminer在导入数据时,只做了变量质量的基本分析,帮助用户剔除无用变量,更多的统计分析指标没有。
在目标变量类型的识别上,对于常见的0,1这种形式,Ymodel可识别出为分类模型,而Rapidminder默认识别成数值,需要用户手动转为分类。同样对于变量中用数字表示分类的情况,Ymodel可以识别出为分类,Rapidminer则只按数据类型识别,需要用户手动去修改。
当模型建好后,Ymodel会自动直接输出最优模型,而Rapiminer则会建议出最优模型让用户自己选择保存哪个。
而且Ymodel在细节上做的也很好,比如在导入建模数据时配置的字符格式,时间格式,缺失值格式等信息会被记录下来,当预测时自动配置好,无需在预测数据上重复配置。
模型结果展示
对于模型结果的展示,Rapidminer则做的比较丰富,一个模型文件里包含很多内容,比如模型模结构,模型表现,模型产生的流程图等
Ymodel的模型结果里可以看到选出的最优模型算法及其参数和模型表现
Weka 的自动建模的模型展示就做的比较简单,只有最基本一些描述
功能
AutoWeka:分类、回归
YModel:分类、回归、时间序列
Rapidminer:分类、回归、聚类、异常值检测
Rapidminer还有一个亮点就是它的自动建模流程是透明的,用户可以在流程图里进行修改和优化,灵活性更高
API
YModel可以集成进用户的自有系统如Java,Python,C#等
Rapidminer提供REST API和Python API
Weka 提供REST API 和Java API
综合体验
Weka |
YModel |
Rapidminer |
|
安装简单 |
★★ |
★★★ |
★★★ |
上手容易 |
★ |
★★★ |
★★ |
建模智能化程度 |
★ |
★★★ |
★★ |
模型结果展示 |
★ |
★★ |
★★★ |
功能 |
★ |
★★ |
★★★ |
API |
★★★ |
★★★ |
★★★ |
English version