打字猴:1.704850133e+09
1704850133 • 简短评论:最高门槛的评判,深度用户沉淀内容。
1704850134
1704850135 当然,对断物而言,标签体系也有它力有未逮的地方,并不一定适合所有场景。
1704850136
1704850137 在上面的案例中,标签适合的是文字表意歧义较小、可以枚举的类型。但在某些领域,标签很难准确地表意或概括。比如,你怎样给人介绍什么是爵士乐?“余音绕梁”“节奏感十足”等,似乎都不能准确传递爵士乐的特点。又如,怎样定义一个人是帅的或漂亮的?大家各有各的标准,很难达成统一。
1704850138
1704850139 在这种情况下,我们需要引入聚类的方式来描述。这种方式并不是以标签词的方式来定义事物是怎样的,而是基于某一维度的特征将相关物品组成一个集合,并告诉你这个新的物品同哪个集合相似。比如,一段藏獒捕食的视频,会同动物世界里猛兽捕食的内容聚为一类,而不会同家猫捕捉老鼠的内容聚为一类。
1704850140
1704850141 在图2–6中,一则汽车降价促销的内容,就同多条汽车销售的内容一起被系统聚合成一类。
1704850142
1704850143 待聚类内容:英朗XT降2.6万 贷款购车免息送油卡
1704850144
1704850145 马自达CX–7现金最高直降2万元
1704850146
1704850147 别克君越现金最高直降3.6万元 现车销售
1704850148
1704850149 沃尔沃V40现金最高直降5万元 现车销售
1704850150
1704850151 揽胜极光促销,置换再享优惠
1704850152
1704850153 图2–6 内容聚类示例
1704850154
1704850155 识人
1704850156
1704850157 与“断物”相对应,我们可以直观地把“识人”理解为给目标用户贴标签的过程,通过标签来描述一个用户的特征集合。
1704850158
1704850159 图2–7就是一个用户在豆瓣FM(豆瓣音乐的频道之一)上的音乐基因名片(用户画像)。如页面中的介绍,豆瓣FM基于用户的红心歌曲、专辑收藏记录进行计算,从而得出记录用户音乐喜好的歌手和风格列表的标签云,标签的尺寸越大代表用户对这个类型的音乐越感兴趣(如果你也想测试一下自己的音乐基因,请访问:https://douban.fm/musicgene)。
1704850160
1704850161
1704850162
1704850163
1704850164 图2–7 某用户在豆瓣FM上的音乐基因名片
1704850165
1704850166 通常,用户画像有三类主要应用场景:
1704850167
1704850168 (1)精准广告营销。用户画像对广告营销来说是最典型的应用场景。当给用户打上各种维度的标签之后,广告主就能够借助这些标签来圈定用户,以便更有效率地触达目标人群。我们以脸谱网的广告投放系统为例,广告主可以选择地域范围、年龄范围、性别、兴趣标签等。通过选择这一系列标签,系统也会实时反馈给广告主目前框定的候选人数。
1704850169
1704850170 (2)行业研究。借助用户画像,我们可以了解不同行业的动态进展。比如,90后、00后的购物娱乐消费分析,不同地域用户的消费差异分析,特定行业中用户的消费特点,等等。通常,平台会定期发布此类报告,帮助内外部人士更好地了解细分领域的最新特点。比如,在腾讯大数据(http://bigdata.qq.com/reports)上,你就可以查看到过往发布的行业研究报告。不久前,引发坊间争论的“成功人士用华为,普通人士用iPhone”,就出自于此。
1704850171
1704850172 (3)产品效率优化。信息匹配是最典型的场景,无论是国内的今日头条、淘宝,还是国外的YouTube、脸谱网,其平台都是基于用户的画像信息来优化推荐排序,以实现人和信息的高效匹配,从而提升效益、降低成本的。据Netflix估算,个性化推荐系统每年为它的业务节省的费用高达10亿美元。
1704850173
1704850174 坊间传闻,基于用户画像的推荐排序还有一些灰色的应用:比如真假货混发,罗振宇在跨年演讲“时间的朋友”中提到,某不良商家会根据用户的收货地址来预估用户的认知水平,从而决定是发送真货、高仿,还是假货;又比如价格歧视,同样一件商品添加进购物车后,不同的用户可能会收到不同的后续反馈,价格敏感型的用户更容易收到优惠券。
1704850175
1704850176 我们通常将用户画像数据划分为静态和动态两类。
1704850177
1704850178 静态用户画像数据:用户独立于产品场景之外的属性,如性别、学历、年龄、婚育状况、常住位置、教育程度等。这些信息往往相对稳定,可通过第三方联合登录、用户表单填写等方式获取。静态数据通常具有统计性意义,比如常住位置在某高档小区的用户可能付费能力更强,女性用户可能冲动性消费更多等。
1704850179
1704850180 动态用户画像数据:用户在产品场景中所产生的显式或隐式行为。显式行为包括对某篇内容点赞、评论、分享,关注了某个作者等。在众多显式行为中,由于产品场景的不同,不同行为的权重也不相同(如对于电商场景,购买的权重>购物车的权重>查看的权重)。隐式行为包括在某页面的停留时长、用户的操作行为轨迹等。通常,显式行为的权重要高于隐式行为,但是由于显式行为更稀疏,所以需要隐式行为来补充验证。
1704850181
1704850182 以下是一些常见的静态或动态用户画像数据:
[ 上一页 ]  [ :1.704850133e+09 ]  [ 下一页 ]