2.4.3 E&E难题

E&E的全称是Explore & Exploit(探索与利用),就是在探索新内容和一直推荐老内容之间,探索出一个平衡点。这类似于参加一个游戏,这个游戏有十种不同的场景,且游戏设置了两条规则:第一条是每参加一种场景都需要花费固定数量的金币来获取积分,每种场景的积分不确定;第二条是可以反复参加同一种场景,或者参加不同的场景,直到金币全部花完后获取最多的积分。

我们每解锁一个场景,就知道该场景下可获取的积分是多少,但其他场景到底积分更多还是积分更少,则是需要我们花费金币去实验的。当我们去尝试新场景时,如果积分更多我们就赚了,但是万一积分更低,则我们就会亏损。一直反复参加一个老场景,其积分是确定的,就像推荐系统一直推荐老内容,这个就是“利用”;去参加不同的新场景,其积分是不确定的,就像推荐系统去推荐新内容,这个就是“探索”。到底拿多少比例的金币去“探索”,拿多少金币去“利用”,就是所谓的E&E难题。

接下来介绍E&E难题在冷启动、多样性、惊喜度三方面带来的实际业务问题。

1.冷启动问题

不管使用哪种推荐算法,冷启动通常都是各个短视频社区面临的非常棘手的问题:新用户进来应该推荐什么样的内容?新内容应该推荐给哪些用户?

在前面已经介绍过,新用户可以推荐热门召回模块的优质内容精品库,将大部分人关心的内容推荐出来;而对于新内容则可以走热门召回的晋级降级通路,让用户和时间去评判内容的真正价值。

在对某新用户给定了一定量的新内容后,其实已经探索出一部分用户感兴趣的内容了,那么是否还要继续探索新内容呢?这时候推荐系统就面临E&E难题,比较稳妥的做法是推荐系统设定一个冷启动结束的指标,在冷启动阶段和成熟阶段分别制定不同的探索程度。

2.多样性问题

由于担心存在信息茧房,推荐系统非常重视探索的重要性,会通过不断尝试将新内容推荐给用户,快速验证新内容与用户的匹配度,根据实验指标迅速迭代并拓宽用户喜爱的品类。但是由于探索是无法保证点击率的,所以在这里就有个取舍的过程,也就是说到底牺牲多少点击率,来换取一个怎样的多样性分布度,同时还要考量E&E的ROI最终是大于1的。

3.惊喜度问题

如何理解用户的惊喜度这个问题呢?其本质就是推荐给用户之前他没有看过的新内容,用户并没有预期自己会看到,但是看了之后用户又觉得很精彩,我们通常可以用用户观看内容的完播率是否比较高、观看结束后是否关注作者等指标来评价用户的惊喜度。

E&E问题在处理惊喜度的时候一直有一个比较通用的方法,就是首先忽略用户的喜好与标签,先将最热门的内容推荐给用户,然后根据用户的反馈去进行动态调整,这个过程可以通过热门内容较大概率地保证用户的惊喜度,同时也能兼顾新内容的探索。