1704850330
1704850331
1704850332
1704850333
图4–3 基于搜索场景的推荐示例
1704850334
1704850335
交互界面
1704850336
1704850337
如果说推荐算法的好坏隐性地影响着用户的体验,那么交互界面的好坏正在显性地影响着用户的感知和行为。
1704850338
1704850339
以最常见的推荐理由为例,这一设计广泛应用于内容推荐、电商推荐的场景。如图4–4和图4–5所示,亚马逊提供的是“购买此商品的顾客也同时购买”商品推荐列表,微信看一看提供的是“好友都在读”“技术大咖在读”内容推荐标签。
1704850340
1704850341
从工程的角度出发,推荐理由提升了推荐系统的透明性,让用户明白为什么会推荐该种类型的内容。站在业务的角度,会更多地从促成转化入手,即什么样的推荐理由可以增加说服力,引发用户认同。
1704850342
1704850343
1704850344
1704850345
1704850346
图4–4 亚马逊商品推荐列表截图
1704850347
1704850348
比如“技术大咖在读”这样的标签,从信息量上来看,弱化为“技术”足矣,保留此种说法的目的是为了满足用户的虚荣感。这跟服装店里导购员对你说的“美女,这件衣服好适合你啊,穿上特别显瘦”是一个道理。
1704850349
1704850350
另一方面,交互界面的调整也能够给系统带来更多的数据反馈和沉淀,我们通常将更被希望引导的用户动作以强形态展现(如更强化的设计、更好的入口位置),并辅以各种引导和降低门槛的措施。以大众点评为例,用户产生的商铺点评是大众点评社区内容体系中非常重要的一环,其点评界面如下:
1704850351
1704850352
1704850353
1704850354
1704850355
图4–5 微信看一看内容推荐截图
1704850356
1704850357
输入框,通过提示的方式引导用户从口味、环境、服务的角度来切入,避免无话可说的情况;图片上传,以积分和后续的等级体系、抽奖反馈来激励用户;推荐菜,直接展示了热门菜供用户选择。各种引导和降低输入成本的措施,促进了单页面的内容积累量增加。
1704850358
1704850359
交互界面的迭代辅助了用户的决策,引导用户按照系统所期望的方式前进,以实现提升系统指标的最终目的。因此,对推荐系统而言,有着“交互界面 > 数据 > 算法”的说法。
1704850360
1704850361
1704850362
1704850363
1704850364
图4–6 用户产生的商铺点评界面
1704850365
1704850366
推荐系统评估指标
1704850367
1704850368
如果我们只关心推荐算法这一内核,其目标就是提高分发效率:让每一篇内容获得更多的阅读,让每一个用户更多地去点击。从算法角度看,评估指标可以大致拆分为两部分:
1704850369
1704850370
推荐准确度。对应到内容推荐系统中,表现为对用户点击的预判(点击率)和对消费情况的预判(点击后的各种主动行为、停留时长)。由于准确度评估是可以复用既有数据进行离线计算的,故通常用于各种算法的迭代。比如,想设计一款新的算法以提升评论量,那么,就将历史上同一用户评论过的内容和未评论的内容输入算法,如果算法能够给前者打分更高,就意味着算法的准确率更高。
1704850371
1704850372
推荐覆盖度(多样性)。好的推荐系统是能够给用户提供视野范围之外的内容的:从用户的角度看,可以评估用户的展示历史中各种题材、类目、话题的丰富程度如何,丰富度越高代表个体体验的多样性越好;从内容的角度看,可以评估有推荐展示的内容占整体内容量的比例,或整个内容分发体系的基尼系数[1]。
1704850373
1704850374
以Netflix为例,站在视频是否被播放的角度,使用了ECS(Effective Catalog Size,有效条目数量)指标来衡量系统推荐的多样性。如果系统内绝大多数的播放都来自同一部视频,ECS指标接近1;如果系统内每部视频都有相近的播放量,ECS指标将等于影片数。更高的ECS指标代表了更好的覆盖度。
1704850375
1704850376
如图4–7所示,对比了应用个性化推荐算法和只采用热门排序算法的情况,两者的ECS指标相差近4倍,即系统中有更多长尾的视频都得到了有效地展示和播放。
1704850377
1704850378
1704850379
[
上一页 ]
[ :1.70485033e+09 ]
[
下一页 ]