对于预测分析,有哪些可以选择的自动化建模工具
目前市场上有很多自动化建模工具,但是能够做到真正完全自动化的产品并不多,有很大一部分产品只是打着自动化的幌子但实际依旧需要人工来定义很多操作步骤。在这里向大家介绍两款自动化程度比较好的建模工具 DataRobot 和易明建模 YModel。
作为自动化建模工具 DataRoboth 和 YModel,都能够自动完成数据预处理,模型搭建和模型评估的一系列环节,使用者无需数据科学专业背景也能构建出高质量模型,但两者在产品体验和部署方面又各有特点。
DataRobot 是一个端到端自动化机器学习平台,从使用流程上看,包含三大模块,首先使用 Paxata 来准备数据,其实就是制作宽表的过程,宽表准备好以后将数据导入 ML Development 模块来搭建模型,模型建好后再使用 ML Operations 来部署模型,进行预测。技术层面,DataRobot 使用大规模并行处理来训练和评估 R、Python、Spark MLlib、H2O 和其他开源库中的 1,000 个模型,支持用户一次性构建上百个模型。因此 DataRobot 是一个比较庞大的自动化建模平台,各种功能比较完善,用户能够实现一个机器学习项目从项目管理到模型部署监测的每一个环节,但是缺点也显而易见。首先界面操作比较复杂,三大模块分别有不同的主界面,每个主界面上又有非常多的子功能,不经过专门的培训用户很难上手。其次,建模过程需要耗费大量的的算力,无形中又增加了成本,同时如此庞大的系统部署和维护起来也会比较麻烦。
与 DataRobot 相比 YModel 则是一个轻量级的自动化建模工具,它只需要一个几百 MB 安装包,用户可以轻松的部署在任何地方。在使用流程上 YModel 包括建模和预测两大部分,它需要用户自己提前准备好数据(实际上很多 BI 系统是可以直接导出的),将数据导入 YModel 会自动完成数据预处理和模型搭建过程,模型建好以后 YModel 会根据模型表现自动选出最优模型组合。然后使用建好的模型就可以做预测。由于 YModel 非常轻量级,它的操作界面也更加简洁,基本看一遍演示视频就能上手操作,因此在易用性方面 YModel 很有优势。另外 YModel 对算力的要求并不高,个人用户甚至在笔记本上就能建模,并且由于采用自主研发的智能寻优方法,建模效率也非常高。当然与 DataRobot 相比 YModel 也有缺点,首先功能上没有 DataRobot 完善,比如项目管理,数据准备,模型部署监测,这些外围功能 YModel 并不具备,需要用户自己完成,其次在模型上 YModel 也不支持用户自己在开源库搭建的模型,灵活性上差一些。
综上 DataRobot 和 YModel 是两款不错的建模工具,都能够自动建出高质量模型。DataRobot 功能更完善,灵活性更高些,但是软件操作比较复杂,部署麻烦,价格比较高。YModel 则操作简单,部署方便,更专注于建模的核心功能,外围功能不完善,价格也比较低。