第四范式 AutoML 的效果
我们选取了10个 Kaggle 比赛数据,分别通过第四范式 AutoML Tables 和 Google Cloud AutoML Tables 产生结果并提交,然后分别计算每种方法的在整个排行榜中的相对排名,如图所示,第四范式的 AutoML 在表数据上的效果大部分要优于 Google Cloud AutoML,其中图中青色代表第四范式,蓝色代表 Google,柱状图越高表示效果越好。
下面我主要从五个方面进行介绍:
- AutoML Tables 的背景
- AutoML Tables 的自动特征工程
- AutoML Tables 的自动参数寻优
- 第四范式 AutoML Tables 的落地案例
- 对未来工作的展望
AutoML Tables 的背景
1. 什么是机器学习?
Tom Mitchell在1997年《机器学习》的教材中讲到,定义如下:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
2. 什么是 AutoML?
- 机器学习步骤
以现实中的场景“反欺诈”为例,介绍下机器学习的步骤。