1704851678
第一,用滥了的标题党,规则直接封禁。
1704851679
1704851680
“惊呆了”“不得不看”这种词汇可以说是用滥了的标题党。由于它们在全网的过度传播,在读者心中,已经基本与“低质”画上了等号。就算内容真的是不得不看,用户也不相信了。
1704851681
1704851682
对于这类标题党的遏制,可以类比对过度广告的遏制。在新《广告法》中,“最”字头、“国”字头以及“唯一”“首个”“领先”等极限用语也被一刀切地禁止使用。对于此类标题党情况,平台可以采用一刀切的管理方式,直接封禁。
1704851683
1704851684
这种一刀切的词汇禁用,是不是有误伤?
1704851685
1704851686
当然有。
1704851687
1704851688
但是考虑到误伤范围和可杜绝的负例,一刀切成了相对可接受的保底方式。只要封禁词库相对可控,就不至于过度伤害内容创作的自由度。
1704851689
1704851690
第二,歧义、蹭名人的标题党,借助阅读反馈发现。
1704851691
1704851692
封禁了“最”之后,广告里还是会有似是而非的用语;封禁了用滥了的标题党,投机的作者还是会以歧义、蹭名人的方式钻空子。以如下两个丧心病狂的标题为例:
1704851693
1704851694
• 美食标题:男生下面好吃,还是女生下面好吃?(讲述的是煮面条)
1704851695
1704851696
• 科技标题:让马云和马化腾都动容的人,这个项目遭BAT哄抢(正文与马云、马化腾完全无关)
1704851697
1704851698
这样的内容可以通过阅读分析、阅读反馈的数据尽早发现和杜绝。
1704851699
1704851700
蹭名人的内容,可以借助文本分析来初步了解正文和标题的实体匹配度是否足够;标题歧义的内容,由于用户的阅读预期和内容差异较大,通常阅读完成度并不好;一些涉及性暗示的标题,可以通过收集和统计样本来训练模型。
1704851701
1704851702
第三,基于作者的过往历史,提供不同授信空间。
1704851703
1704851704
再次强调,平台遏制标题党目的是为了“保证阅读体验”,只要阅读体验足够好,那么在标题、封面层上的炫技是可以接受的。
1704851705
1704851706
因此,在同一个平台上,历史表现不同的作者会拥有不同的授信空间。
1704851707
1704851708
在系统识别出标题党的概率后,对不同作者的处理方式会有尺度上的松紧之分。劣迹作者可能干脆就不会获得推荐量,优质作者则可能不会有太多降权,甚至会有人工复查的机会。
1704851709
1704851710
把好的阅读体验带给更多人,站在这一点上,平台和自媒体的利益诉求是一致的。
1704851711
1704851712
推荐平台优化:从SEO到REO
1704851713
1704851714
如果你经历过PC互联网时代,就一定不会对SEO(Search Engine Optimization,搜索引擎优化)感到陌生。
1704851715
1704851716
在PC互联网时代,搜索引擎是每个网站不可或缺的流量源头。在特定的搜索词下,更好的搜索结果展示位就意味着更高的搜索流量。为了从搜索引擎获得更多的流量,网站运营者总结了各种各样的优化方式,根据其是否利用了搜索引擎漏洞而被分为“黑帽SEO”和“白帽SEO”。搜索引擎公司也秉持着堵不如疏的心态,尽可能地开放自己系统内可被人理解的信息抽取规则、内容排序规则,以提升业务的透明度,与网站保持信息通畅、良好互动的关系。
1704851717
1704851718
理想态下的白帽SEO,是在网页内容有价值的前提下,提升网页内容对搜索引擎的友好度,并逐步通过自有品牌的建立,获得越来越多不依赖于搜索引擎的品牌认知流量。
1704851719
1704851720
对推荐引擎而言,其理亦然。内容就像是网站的网页,可以优化内容的构成与包装方式,让它适应不同平台的推荐分发规则从而得到更高的曝光量,我们姑且称之为REO(Recommend Engine Optimization)吧。
1704851721
1704851722
让推荐引擎正确理解内容
1704851723
1704851724
看过了之前的内容,相信你已经大概了解了一篇内容在经历了哪些过程后,才能被推荐引擎展示给用户。自媒体应该认识到的是,自己的内容首先需要过机器这一关,然后才能够被分发给用户。只有让推荐引擎正确地理解内容,才能更有助于内容的精准分发。
1704851725
1704851726
对图文内容来说,其实相对简单,在大部分情况下只要正常写作即可。推荐引擎会根据正文内容进行文本分析从而判断其主要的内容分类和话题,以进行后续推荐。在涉及一些英文内容的时候,要尽量补充对应的中文译名,以提升机器的理解程度。
1704851727
[
上一页 ]
[ :1.704851678e+09 ]
[
下一页 ]