一直播千万量级用户推荐系统设计之路

作者简介

冯丙见

一下科技大数据部门资深架构师

一直播现在大家都能看到它的影子，技术上面来讲很多东西都是通用的，可以在这里面借鉴一下，看看是不是有一些在你工作当中可以适用的东西。

从三个方面介绍一下我们的系统，一个是面向我们架构设计，一个是用户画像系统，还有一个是评估推荐系统。

1、推荐系统架构设计

我们先来看一下推荐系统产生的背景，随着互联网技术发展，信息过载成为普遍问题，信息消费者，从海量信息中找到自己感兴趣的内容比较困难，作为信息生产者，让自己生产的信息脱颖而出，受到广大用户的关注也是比较困难的。

这个问题很早之前就已经意识到了，并且有了解决方案。最早的解决方案是以雅虎，后来推出了搜索引擎，因为搜索引擎找到相关的内容给用户，如果用户描述的关键字不准确，或者用户本身没有什么需求，这个时候推荐系统不需要用户描述它的需求，是根据它的历史给用户推荐感兴趣的内容，推荐系统是用来满足用户需求不是很明确的时候，帮用户找到可能感兴趣的内容。

推荐系统的主要任务就是建立用户和信息之间的联系，一方面帮用户找到他可能感兴趣的内容，同时另一方面把信息呈现在可能对它感兴趣的用户面前，以此达到双方共赢。

解决海量信息过载时用户获取信息效率，解决用户无明确需求时信息获取，长尾物品推荐，满足小众个性化需求，我们现在常见的是个性化推荐，已经成为了各大网站的标配了。

再一个 app 上面的话是中间件存在，一个内容的话，是推荐系统根据模型推荐你内容，同时做一些相关性的推荐，比如说“看了又看，买了又买”相关性的推荐。或者你买了一个东西，给你推荐和这个东西最相关的，在一些社交网站会推荐一些相似用户或者好友相似推荐。我们会预测到用户感兴趣的话，会给推一些感兴趣的信息。

我们看一下整体流程，过滤出优质内容，去除低速、敏感信息。我们根据用户的兴趣找到他感兴趣的内容，用常用的一些算法找到感兴趣的内容，比如说看了一个美食的视频，就可以把新的视频推荐给你。

如果发现你跟某一个人很相似，那个人看过我的视频，你没看过，就可以把这个推荐给你，在这个量级，一个用户很难说一天一次把这些多文章和视频看完，所以我们进行三步走，就是把用户最感兴趣的内容放在最前面，根据用户、物品特征，含量信息预估视频的可能性，根据这个可能性从高到低的排序，把最可能看的推荐给他，经过这一步之后剩下的可能是几十个或者几个了，这个量级用户一次是有可能看完的。

我们看一下推荐系统的架构，在推荐系统里面用户跟系统有两种交互的场景，右边这个表示的是用户的一些行为数据，比如说观看信息、购买信息之类的行为信息会上报到我们的接收服务里面，缓存到消息推荐里面，后面会做两种方式的处理，一种是用这种数据训练两种模型，用来做后面的推荐用。

我们看一下推荐系统常用的算法。流行度推荐算法是热门排行榜，基于内容是标签推荐。协同过滤有 UserCF 基于用户协同过滤；ItemCF 基于物品协同过滤；ModuleCF 基于模型协同过滤，还有基于图模型，基于社交关系。

推荐系统架构—排序

在召回阶段，多个通道的召回的内容是不具有可比性的，并且因为数据量太大也难以进行更加精确的偏好和质量评估，因此需要在排序阶段对召回结果进行统一的准确的打分排序。

它的做法就是右边这张图，结合用户的一些行为数据模型来，然后当用户访问的时候，我们会拿到一些符合用户的特征，我们刚才拿到了列表，用户这次什么时候访问的，使用什么设备访问的，以及什么地方来的，这种信息输出到这个排序模型里面会反馈一个结果，用户看了这个视频这个物品的可能是性多少，按照这个可能性进行从高的排序，把这个结果反映给我们。

排序 -LR+GBDT，Facebook2014 年的一篇论文中，提及到 GBDT+LR 的解决方案，先使用 GBDT 对一些稠密的特征进行特征选择，得到的叶子节点，再拼接离散化特征放进去 LR 进行训练。利用 GBDT 替代人工实现连续值特征的离散化，而且同时在一定程度组合了特征，可以改善人工离散化中可能出现的边界问题，也减少了人工的工作量。

2、画像系统

我们介绍一下第二部分是推荐系统—用户画像，应用的场景最主要的是用户分析和研究用的，就是单一用户行为细致分析和用户调研，可以做单独群体使用习惯研究。还有产品和运营，了解系统用户现状，优化用户体验实现精准营销，实现精准化营销。

是可以跟业务系统相关的，推荐系统，基于内容统计，排序阶段特征获取，PUSH 系统，找到可能对主播感兴趣的用户。用户刚好喜欢这个主播所具有的特征，给他发信息，以此让他参加。

我们看一下用户画像的架构，最底层是原始数据，比如说物品的信息，还有各种日志，观看日志，评论日志，送礼日志等等，有了这些以后对它们进行规划。可以做一些统计行为信息，用户什么时间段喜欢看视频，每天看多少个，用户的付费能力怎么样，每天付费多少，可以根据这些行为日志，算出用户的兴趣，比如一个用户经常看跟美食相关的视频。有了用户画像以后，可以提供给运营系统，还有 push 系统。

用户画像分几类，一个是基础属性年龄、性别、设备型号、安装渠道、常驻地等等。用户行动就是观看时段、观看时长、消费等级、活跃度。用户兴趣是感兴趣的类别和感兴趣的标签。

3、评估推荐系统好坏

最后讲一下评估推荐系统好坏。算法评价指标有三类，1. 准确率，推荐列表中用户喜欢的物品所占的比例。2. 召回率，用户喜欢的物品出现在推荐列表中。3. 覆盖率，描述一个推荐系统对物品长尾的挖掘能力，推荐系统能够推荐出来的物品占总物品集合的比例。

产品层面，1. 用户留存；2. 用户付费率；3. 用户观看时长。

目标就是制定一个 KPI，推荐系统的算法跟别的不太一样的，不像传统的能够定量知道加几台服务器接口能够提升多少，做法就是要进行不断大量的实验，找到真正可以提高的算法，流程就是首先要做一些离线实验，当我们确定算法以后进行一些离线实验，本身会得到一些算法上面的指标评估，进行 AB 测试然后查看结果，调优算法，达到我们的目标会给它切更多流量，如果没有达到这个目标就下线，这种方案不太成功的话，我们就换一种方式。