Quantcast
Channel: InfoQ - 促进软件开发领域知识与创新的传播
Viewing all articles
Browse latest Browse all 1638

AutoML 在表数据中的研究与应用

$
0
0

第四范式 AutoML 的效果

我们选取了10个 Kaggle 比赛数据,分别通过第四范式 AutoML Tables 和 Google Cloud AutoML Tables 产生结果并提交,然后分别计算每种方法的在整个排行榜中的相对排名,如图所示,第四范式的 AutoML 在表数据上的效果大部分要优于 Google Cloud AutoML,其中图中青色代表第四范式,蓝色代表 Google,柱状图越高表示效果越好。

下面我主要从五个方面进行介绍:

  • AutoML Tables 的背景
  • AutoML Tables 的自动特征工程
  • AutoML Tables 的自动参数寻优
  • 第四范式 AutoML Tables 的落地案例
  • 对未来工作的展望

AutoML Tables 的背景

1. 什么是机器学习?

Tom Mitchell在1997年《机器学习》的教材中讲到,定义如下:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

2. 什么是 AutoML?

  • 机器学习步骤

以现实中的场景“反欺诈”为例,介绍下机器学习的步骤。


Viewing all articles
Browse latest Browse all 1638

Trending Articles