Quantcast
Channel: InfoQ - 促进软件开发领域知识与创新的传播
Viewing all articles
Browse latest Browse all 1638

推荐召回算法之深度召回模型串讲

$
0
0

导读:本文来自“深度推荐系统”专栏,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文将结合作者在工作中的经验总结,着重于串讲推荐召回层的模型变化。

推荐系统的基本架构并不复杂,一般由索引、召回、粗排、精排以及展控几个部分构成。而其中的召回模块(也叫Matching、触发等)则主要负责根据用户和内容特征,从众多的内容库中找到用户可能感兴趣的内容。一般而言召回模型是多路并发存在的,各路召回模型之间互不影响。本文将重点技术在深度学习技术的驱动下,召回模型的几大类模型。

Youtube DNN召回

但凡Google工业界出品,必属精品。这篇论文也不例外,自从2016年提出以来备受万众瞩目甚至被奉为推荐领域集算法模型与工业实践神级大作。虽然在深度学习已经成为工业界常规操作的今天回头来看这篇论文的算法架构并不觉得有特别惊艳的地方,但是仍然是工业界效果上当之无愧的主流算法与强有力的baseline。

原始论文主要介绍了Youtube推荐架构的召回和精排各自相应的深度网络结构两个部分内容,因为本文着重串讲召回模型所以专注于第一部分召回层的部分。自底向上查看如下的网络结构:

  1. 特征输入层包含了三部分内容:用户观看过的video的embedding向量、用户搜索词的embedding向量以及用户的地理位置年龄等静态特征;这里的embedding向量作者是用word2vec类方法预先生成的。
  2. 线下模型训练阶段,三层ReLU神经网络之后接到softmax层,也就是说在这里作者建模为为用户推荐下一个感兴趣视频的多分类问题,输出是在所有候选视频集合上的概率分布。
  3. 线上预测阶段,考虑到召回的高性能需求首先通过userId找到相应的用户向量,然后使用KNN类方法找到相似度最高的N条候选结果返回。


Viewing all articles
Browse latest Browse all 1638

Trending Articles