打字猴:1.704850052e+09
1704850052 一方面,规则是最快的上线生效途径,可以用于纠偏、提权等操作。举个例子,在《中国有嘻哈》开播之前,大众是不知道红花会是什么的。彼时你搜索红花会,搜索引擎会告知你它是金庸先生《书剑恩仇录》里的一个江湖组织。而当《中国有嘻哈》开播后,所有人突然开始搜索红花会了,系统的滞后让它无法快速理解用户的真实意图。这时,产品经理就该进行规则干预了,标注红花会是一个嘻哈团体。
1704850053
1704850054 另一方面,我们需要认识到的是:短期的干预是应该逐步被长期的机制所替换的。规则就像打补丁,短期打补丁能够遮住窟窿,但长期补丁叠补丁这衣服就没法穿了。太多的规则系统会严重增加系统的复杂度,降低可理解性。
1704850055
1704850056 同样以“红花会”为例。在这个问题上,我们应该下力气解决系统的滞后性,让它能够更快速地实现搜索意图理解的进化(比如监控全网产出的新内容,分析其中的共现词汇特点)。如果有一天,有位流量明星主演了《书剑恩仇录》,那么大众对“红花会”的认知,是否又会重回武侠小说了呢?系统里配置的规则“红花会=嘻哈团体”是否又会变得不合时宜呢?
1704850057
1704850058 我个人笃信的是:从长线来看,人力所能覆盖的规则语义和逻辑复杂度是无法胜过机器的。对于初始场景或应急情况,规则系统必不可少,是用于保证服务质量底线的措施。但随着系统的逐步复杂和进化,产品经理也应该学会退位,让机器不断逼近更好的上限。
1704850059
1704850060
1704850061
1704850062
1704850063 内容算法:把内容变成价值的效率系统 [:1704849725]
1704850064 内容算法:把内容变成价值的效率系统 推荐的起点:断物识人
1704850065
1704850066 尽管推荐系统中应用了各种高深的算法、架构,但其基础原理是朴素的:更好地了解待推荐的内容,更好地了解要推荐给的人,从而更高效地完成内容与人之间的对接。断物识人,是一切推荐行为的起点。
1704850067
1704850068 断物
1704850069
1704850070 想要把内容推荐给人,首先需要充分理解内容的特点到底是什么。如果连待推荐内容的特点都说不明白,那就妄论推荐效果了。更好的提取和表达待推荐内容的特点,就是断物的意义所在。
1704850071
1704850072 如你所熟知的那样,断物最简单的方式就是“贴标签”。
1704850073
1704850074 介绍人或者物品,就是贴标签的一个典型应用。先提这样一个问题,你怎么向朋友介绍一个他一无所知的人?
1704850075
1704850076 如果你的朋友是程序员,你也许会说:“他是今日头条的高级工程师,负责某系统的开发。”对你的球友,你也许会讲:“他大学时期是校篮球队的,拿过两次全市冠军。”对你的酒友,介绍方式或许又变成了:“我担保他是个好酒友,有量有趣,从不冷场。”
1704850077
1704850078 “高级工程师”“篮球”“有酒量”“人有趣味”都是用来描述同一个人的标签,有职业维度、有兴趣爱好。为了说明不同维度的程度,你还会辅以可量化的信息,如“负责某系统的开发”“拿了市冠军”等;对于不好量化的部分,则会用自身的认知和信誉作为佐证:“我担保……”
1704850079
1704850080 但是,这个人只有上述这些特点吗?当然不是。也许他又帅又高,有八块腹肌;也许他爱好跑步,能够跑下来马拉松全程。那为什么你在介绍的时候,只选择了他的部分标签呢?因为你考虑了受众的特点,选择了对受众来说,最容易引起共鸣、也最具有代表性的标签。给球友介绍他是高级工程师、给酒友介绍他是校篮球队的成员,尽管从输出信息的准确性上来看并无错误,但是在信息的接收效果上就产生了偏差。
1704850081
1704850082 标签是我们对多维事物的降维理解,抽象出事物更具有表意性、更为显著的特点。在不同的应用场景下,我们会对标签全集进行有针对性地投射,有倾向性地选用不同的标签以换取信息匹配效率最大化。
1704850083
1704850084 在上面这个例子中,有人会关心:对推荐对象的信息整理是否可以更好地结构化呢?比如,可以将一个人的信息划分为基本信息(性别、生日)、教育背景、职业信息(公司、职级)、兴趣爱好等。通过更系统化的分类方式,可以完整地呈现出一个人的特点。这其实涉及“标签”和“分类”的关系。
1704850085
1704850086 通常来说,分类是树状的,是自上而下依次划分的。在分类体系里,每个节点都有严格的父类继承关系,在兄弟节点层都具有可以被完全枚举的属性值。比如,将人类属性基于性别划分为男女,就能够覆盖全部人类属性了。由于树状的层次结构性较好,所以在内容的分类查找领域有很多应用。比如,在淘宝购物时筛选的路径如图2–1所示,就是一种分类体系的应用场景之一。
1704850087
1704850088
1704850089
1704850090
1704850091 图2–1 淘宝网购物分类
1704850092
1704850093 应用分类时必须考虑分类权威性和信息完备性问题,避免因为子节点覆盖不全或分类错误导致的认知问题。比如,在一些内容创作平台上,用户就经常会反映自己上传作品没有合适的可选择分类的情况。通常,我们建议由专家系统进行编辑分类,这样才能够最大化分类结构的可用性。
1704850094
1704850095 标签是网状的,更强调表达属性关系(has a)而非继承关系(is a),只有权重大小之分,不强调包含与被包含关系。这就使得相对于分类而言,标签的灵活性更强。在权威性方面,标签是弱化的,每个用户都可参与进来,基于自己的偏好贴标签,从而借助规模效应实现对信息表意完备性的覆盖。
1704850096
1704850097 由于网状结构包含树状结构,故而标签可以被应用于分类的场景。在我们设计系统时,可以先基于产品场景快速覆盖主要标签,再结合标签集合的使用频次、专家建议等因素逐步将部分入口收敛到树状的分类体系中来。
1704850098
1704850099 标签的产出
1704850100
1704850101 标签从何而来?典型的产出方式有专家系统产出(PGC)和普通网友产出(UGC)两种。
[ 上一页 ]  [ :1.704850052e+09 ]  [ 下一页 ]