在12月 7-8 日于北京举办的 ArchSummit 全球架构师峰会上,在领英机器学习组从事机器学习算法、特征量和平台的研发的张镭分享了大规模机器学习在领英预测模型中的应用,以及领英在预测模型创建上的成功实践和踩坑经验,以下为演讲的主要内容整理。
预测模型在LinkedIn的产品中被广泛应用,如 Feed、广告、工作推荐、邮件营销、用户搜索等。这些模型在提升用户体验时起到了重要的作用。为了满足建模需求,LinkedIn开发并且开源了 Photon-ML 大规模机器学习库。Photon-ML 基于Apache Spark,能快速处理海量数据并具有强大的模型训练和诊断功能。
本文将从以下三个方面进行介绍:
- LinkedIn产品使用预测模型的情况
*分享预测模型系统在实践中的成功经验和踩坑教训
*案例研究
LinkedIn产品使用预测模型的情况
LinkedIn的很多产品是人工智能(AI)驱动的,如 Feed、广告、工作推荐、邮件营销、用户搜索等。预测模型对LinkedIn用户体验产生了巨大的影响。比如,LinkedIn的 Feed 产品,当用户登录LinkedIn主页后,系统会根据用户画像提供个性化信息流,包括热点文章、图像、视频、朋友和同事分享的近况,以及所关注公司新闻等。LinkedIn还会向用户推荐工作机会,其核心产品被称为 Job You Maybe Interested In(简称JYMBII)。用户通过LinkedIn“工作”页面可以看到这款产品。它会根据用户的工作经验、工作本身的需求和描述等信息为用户推荐相关工作。此外,在LinkedIn的 Email 营销产品中,针对LinkedIn的免费注册用户,其可以通过模型来预测其中哪些用户可能会转化为付费用户。通过给潜在的付费用户发送 Email,吸引他们转化成为付费用户。此外,还有LinkedIn还有其他很多产品使用了人工智能和机器学习技术,产品背后都是预测模型在支持。