作者 | 闫泽华 知乎知识市场产品总监
当音乐应用变得越来越懂你,当新闻客户端逐一装配了推荐引擎,当各色巨头纷纷入场短视频算法分发:图文、音频、视频,种种信息载体正借由算法的力量提速分发效率。
愿意或不愿意,你我已经事实上被时代的浪潮所挟裹,走进了内容的算法分发时代。
对于算法分发很多人会有所误解,这或许源自我们的远观,缺乏了解才会觉得算法猛如虎。而当走近了算法分发,有了一定的了解之后,或许会有重新的认知:纵然算法如虎,也可细嗅蔷薇。
1断物识人,推荐起点
尽管算法分发中应用了各种高深的模型或公式,但其基础原理是朴素的:更好地了解待推荐的内容,更好地了解要推荐给的人,才能更高效的完成内容与人之间的对接。
从这个角度来看:断物识人,是一切推荐行为的起点。
何以断物,何以识人?用打标签的形式最容易理解。
标签是对高维事物的降维理解,借由单个短语抽象出了事物更具有表意性、更为显著的特点。在不同的业务消费场景下,我们会选择不同的标签集合来对内容和用户进行标注。
比如,对于职场社交应用,职业背景、工作经历会是用户重要的标签;而对于兴趣社交应用,兴趣偏好类的标签则具有更高的权重。
在内容画像层面,有两种典型的标签产出方式,以音乐为例:
专家系统:潘多拉(Pandora)的音乐基因工程(Music Genome Project)。在这项工程中,歌曲体系被抽离出450个标签,细化到如主唱性别、电吉他失真程度、背景和声类型等等。
每一首歌曲都会被经由工作人员耗时30分钟左右,有选择性标注一些标签,并以从0到5的分值代表这一标签的表征程度。
UGC产出:在豆瓣音乐,音乐的标签化体系源于普通网友的贡献。群体的力量为豆瓣积累了大量具有语义表意性的标签。
而由于用户的多样性和编辑的开放性,用户标签需要经过特定的清洗和归一化才能投入使用。
而在用户画像层面,则可以大致划分为静态和动态画像两个层面。
静态画像:即用户的设备信息、地理位置、注册信息等等。通常,我们将用户的静态信息认为是业务无关信息。
动态画像:用户在使用某一项业务时,和业务所提供内容服务产生交互后的显性或隐性种种行为,构成了用户画像的动态部分。以视频消费场景为例,点赞、评论、分享等种种显性动作都会让用户与相应的内容标签产生关联。而拖拽行为、播放完成度、页面停留时长等隐性行为则得以让系统更好的衡量用户在特定标签下的偏好程度。
内容画像和用户画像,借由业务场景下的交互,构成了一个相互影响的循环系统。
内容画像决定人的画像,自然是最容易理解的。在音乐场景下,你收听、收藏、评分了很多爵士类的音乐,那么系统就会判定为你是一个喜欢爵士音乐的用户;在读书场景下,你完整阅读、点评了哪些书籍,哪些书籍做了笔记,哪些书籍只是潦草翻阅,都会影响系统中你的用户画像。
因此,“你的选择决定你的画像”可以说丝毫不为过。
而反过来,用户的画像也会影响到内容的画像。我们可以将其看作是基于典型画像的用户行为对内容做出的后验投票。
在一个大体量的视频上传体系里,人工打标签的方式已经不具有可行性了,只有用户的播放行为才有助于我们更好的揣测视频内容的分类。
在实际工程应用中,由于内容的复杂性与多样性,画像远不止于预设的标签集合。在这种情况下,我们引入了聚类的方式来表征内容。
在聚类的方式下,我们不再试图用标签词来描述事物,而是基于某一维度的特征将相关的物品组成一个集合,用“物以类聚”来试图说明内容的特征。比如,一段藏獒捕食的视频,会同动物世界里猛兽捕食的内容聚为一类,而不会同家猫捕捉老鼠的内容聚为一类。
2协同过滤,群体智慧
如前所述,标签的应用更多的是在帮助我们快速建立对事物的抽象理解。而由于前置标签系统的有限性和封闭性,必然不足以应对更复杂多变的新增场景。比如,一则大吃猪肘子的短视频,你应该如何标签或分类?是美食还是猎奇,亦或是生活记录?
放弃标签,转而以用户的群体消费行为进行分类和记录,这就是协同过滤的基础思想。
举一个生活中的场景,初次为人父母,“无证上岗”的新手爸妈们内心是激动而又惶恐的。打听,成了他们育儿的重要法宝之一。
“你家宝宝用的是什么沐浴液啊、你们有没有上什么早教班啊…”亲子群中,无时无刻不在发生这样的讨论,这样的讨论也构成大家后续消费决策的主要因素之一。
这种基于人和人之间的相互推荐固然是弱社交关系分发的一种形态,但是促成大家有价值信息交换和购买转化的,其实是人和人之间的相似点:为人父母、拥有相似的价值观和消费观。
把用户的消费行为作为特征,以此进行用户相似性或物品相似性的计算,进行信息的匹配,这构成了协同过滤(Collaborative Filtering)。
协同推荐可以分为三个子类:基于物品(Item-based)的协同、基于用户(User-based )的协同和基于模型(Model-based)的协同。
基于用户的协同,即切合了上面的例子,其基础思路分为两步:找到那些与你在某一方面口味相似的人群(比如你们都是新手爸妈,倾向于同一种教育理念),将这一人群喜欢的新东西推荐给你。
基于物品的协同,其推荐的基础思路是:先确定你喜欢物品,再找到与之相似的物品推荐给你。只是物品与物品间的相似度不是从内容属性的角度衡量的,而是从用户反馈的角度来衡量的。
使用大规模人群的喜好进行内容的推荐,这就是在实际工程环境里,各家公司应用的主流分发方式。
基于模型的协同,是应用用户的喜好信息来训练算法模型,实时预测用户可能的点击率。比如,在Netflix的系统中就将受限玻尔兹曼机(Restricted Boltzmann Machines, RBM)神经网络应用于协同过滤。将深度学习应用于基于模型的协同,也成为了业界广泛使用的方式。
3由冷到热,内容的算法分发生命周期
作为连接内容与人的推荐系统,无时无刻不在面对着增量的问题:增量的用户,增量的内容。
新的用户、新的内容对于推荐系统来说都是没有过往信息量积累的、是陌生的,需要累积一定的曝光量和互动量(阅读、分享等)来收集基础数据。这个从0到1积累基础数据的过程就是冷启动,其效果的好坏直接关系到用户端、作者端的满意度和留存率。
如果我们假设一篇新内容要经过100次阅读才能够得到相对可信的内容画像,新用户同样需要完成100次阅读之后才能够建立起可用的用户画像。那么一个最直观的问题就是:怎么样达成这100次有效的阅读?
这就是冷启动面临的问题。下面我们从内容和用户两个维度来分别论述。
在推荐系统中,通过分析一篇内容的标题、关键字来确定要向哪个目标人群进行探索性展示,借由探索性展示完成了从0到1的用户反馈积累过程。
在这个冷启动过程中,如果没能得到足够正面的用户反馈(点击行为和阅读体验),系统就会认为这篇内容是不受欢迎的,为了控制负面影响,就会逐步降低这篇内容的推荐量。
反之,如果内容在冷启动过程中顺利找到了自己的目标人群,收获了很高的点击率,就有可能被推荐系统快速放大,具有了成为爆款的可能。
因此,冷启动决定一篇内容命运的说法,可以说丝毫不为过。
以时下最火热快手类小视频应用为例,一则视频在分发过程中的生命周期,亦跳不脱“丰富先验信息、依赖后验信息”这一定律。
在一个小视频应用里面,大体上会有三类人:半职业或职业的生产者、视频工具的使用者、视频内容的消费者。
从信息的消费性角度来看,其结合方式大概率是第一类人生产,第三类人消费。先验信息就是尽可能多挖掘出第一类人的固有特征,比如作者是谁(考虑关注分发)、配的音乐是什么、是否有参与活动话题(考虑活动分发)等等,对于足够的头部生产者还可能会以运营介入的方式去人工标注,去完善先验信息。
客观上说,小视频先验信息的丰富程度是远小于文本内容的,我们将其类比微博类的短文本内容或者全图片内容可能会更合适。先验信息的缺乏,使得小视频的分发过程更依赖协同算法支撑下,用户参与行为的后验信息的补充。
在冷启动的环节里,一则小视频会分发给特定类别的用户来查看,系统从用户角度去统计不同聚类用户的播放情况(如完整播放、分享、点赞、评论、重复播放等),以用户行为的后验信息去刻画小视频特征,以解答:“哪一类用户会喜欢这则视频”这一问题。
比如,时下很热的海草舞,不同的生产者都会上传类似主题的视频,哪个更好?
在业务场景里,真正值得依赖的一定不是专家,而是基于普通用户真实观看行为的投票,才能选择出更值得扩散内容,用以优化全局的效率。
对于用户冷启动,算法分发所做的则是一个剪枝和快速收敛的过程。
这是因为算法分发首先服务的是业务的大目标,即用户的留存率。毕竟,只有保证了留存率的前提下,尽可能的留住用户之后,系统才会有进一步探索用户的可能性。人都留不住,推荐的多样性、兴趣探索等等自然无从谈起。
因此,算法分发会更倾向于在有限次数的展示里尽可能快的探索出用户的兴趣点,会从覆盖面大的兴趣内容开始,逐步缩小范围,以用户的点击反馈来确定其更感兴趣的类目,并通过快速强化已知兴趣偏好下的内容分发量来试图留住用户。
4三分天下?编辑、算法与社交
不夸张的说,算法分发将是未来信息分发行业的标准配置。
为什么这么说?因为算法是个筐,什么都能往里装。在内容展现和推荐的过程当中,可以参考下述公式:算法分发权重=编辑分发权重 + 社交分发权重 + 各种算法产出权重。
如果将任意一个权重设置为1,其他设置为0,算法分发系统就会变成一个标准的编辑分发系统或者是社交分发系统。也就是说,算法分发的基线就是编辑分发或社交分发。
从这个角度来看,只要算法应用的不太差,基本上引入算法分发一定是正向。因为它在有限的货架里,围绕用户展示了无限的货品。
在业务层面,我们通常会复合型使用三种分发,在不同的环节应用不同的因素,才达到最好的效果。
以知乎读书会为例,我们将其划分为:内容生产、用户触达和反馈改进三个部分。
在内容生产中,为了保证调性,一定是需要引入编辑专家去选人、选书的。选择的书是否有价值,选择的人是否是行业专家,还是职业的拆书人,都是体现产品价值观判断的事情。
当内容从生产进入流通,进入触达环节后,为了追求效率的最大化,人工干预的作用就会相对弱化。
举一个业务场景的例子,对于读书类产品,运营一定会有今日推荐的需求,推荐给用户今日读书会上新了什么大咖领读的书籍。从编辑的角度,领读人是大咖,书是经典,编辑权重一定非常高。
乍听来很合理的需求,当进入用户场景后就会发现其值得商榷:首先,用户不是每天都来的。如果他一周来一次,那么提供给他的应该是今日推荐,还是本周推荐呢?
进一步,考虑到用户偏好问题。你是应该把物理学大咖的内容强加给他,还是推荐给他一个朋友们最近都好评的一本领读书(社交分发),又或者是他自己已经标注了“想读”的一本艺术类书籍的解读呢?
在信息触达环节中,产品应当追求的是信息和人的有效链接,是用户体验的最大化而非产品经理意识的最大化。
当服务收集到了足够多用户数据的时候,又可以反过来影响内容的二次迭代。在迭代的环节中,编辑的作用又凸显了出来,结合数据的反馈来对内容进行调整:内容的播放完成率为什么低?是稿件问题,还是领读人语音的问题,是否需要重新录制等等。
站在编辑分发和社交分发之上,算法分发一定能够获得更大的发展、收获更多元的可能性。
5算法的价值观
算法有没有价值观呢?
算法或许并没有价值观,但算法背后的人却是有价值观的。
作为数据指标导向的算法系统,其优化迭代过程就是一个持续趋近数值目标的过程。因而,数值目标的合理性决定了整个算法分发系统的合理性。假使仅以点击率为优化目标,就一定会导致标题党泛滥;点击加时长目标的结合能够一定程度抑制标题党的产生,但是也极有可能导致用户多样性的丧失。
在工程应用中,我们通常会设定一系列的指标:如多样性、原创比例、内容时效性等等作为基线,用以保证用户的基础体验可控或平台的调性可控。在保证了这些基础指标之上,再持续优化核心指标:如点击、时长等。毕竟,只有一组复合的数值目标,才有助于指导算法分发系统健康、快速的增长。
通常,我们可以借由两个场景来一窥各个内容分发产品的调性所在。
新用户冷启动:
新用户消费体验,是内容分发服务的试金石,相较之下就能够一览不同内容分发平台的价值观。
一方面,新用户是通过不同渠道获取的,平台获取到的是怎样的用户,就会推荐相应的内容;另一方面,平台会试图用自己更擅长的方式来保证用户留存,在信心不足的情况下,就势必会沿着马斯洛需求模型下探,试图用更底层的内容来获取更广泛的受众。
这就是为什么很多短视频或小视频应用,打开后满屏都是白衣校花大长腿的原因。无他,无计可施只能下探人性。
推荐多样性:
多样性是另一个评估分发产品调性好坏的方式。丧失多样性,深挖用户的局部兴趣点,一定是短期收益最大化的。
比如用户喜欢看科比,那么连续推送科比的比赛视频,一定可以让用户刷到深夜两点。但是站在产品的长线生态来看,我们需要更长久的留住用户,而不是短期让用户沉迷。
在短期时长和长期留存的抉择中,就依赖于产品设计者的价值观判断了。
在信息分发方面,做点击、拉时长、涨留存有种种方法,而在所有的方法当中,拉低下限一定是最容易的手段。但在可选的范围里,我们或许可以试图回归内容价值,去尝试挑战上限而非拉低下限:
Try to save time,not just kill time!
6不同平台下的创作者生态
在国内,有形形色色的内容创作与分发平台。通用平台如微博、微信,内容垂类如小红书、什么值得买,载体垂类如抖音、快手,人群垂类如Blued、糖豆广场舞等等。不同的平台上生长出了不同的创作者生态。
而决定平台生态的根源,是一个问题:对于平台来说,创作者究竟是什么?
如果把平台比作商场、创作者比作商家的话,不同的平台会有不同的选择,最典型的两种莫过于:自营 V.S 第三方运营。
自营的场景下,整个商场的店铺或货架由商场自有自营,流量的中心化控制会更强。创作者对于商场而言,更多的退化成为了供货商。
在第三方运营的场景下,商场更多的提供铺位,所有交得起入场费的品牌都可以入驻开设店铺。从而让创作者拥有了更大的自主权,流量的分布从以商场为核心的单点中心演变为以商铺为核心的多点中心化。
直营商场的好处当然是体验可控、甚至于能够在某个特定垂类人群身上做到近乎可量化范围内的极致体验。由于其收取的是商品流通的利润,因此商场可以在短期内攫取巨大的红利,并用这些利润去给商场自身打广告,做新客获取来扩大规模。
但这样做的坏处也很显然,只能作为供货商的创作者,由于缺乏足够的利润激励和自主权,很难生长出新的玩法或全新的品牌。
而开放给第三方运营的商场,赚取的只是房租,将商品流通过程的利润开放给了创作者。在经济利益的刺激下,创作者具有更大的灵活性和主观能动性,从而促进了生态的繁荣,衍生出更多的可能性。
当然,香花虽多必有毒草。开放给第三方运营的商场同样需要面临各种钻空子的举措,比如会有各种在商场入口发小广告的(刷屏、诱导分享),以图谋短线的方式来攫取商场的流量。商场只有通过后验的方式来对此类行为进行处理,这或许就是局部失控与全局可控的关系吧。
在国内,全部直营的商场比比皆是;近乎完全开放给第三方运营的大商场,则恐怕只有微信了。在所有平台都在告诉你什么是对的时候,只有微信很克制地告诉你什么是错的。
什么是对的,画了一个上限,平台的上限就是创作者的上限;
什么是错的,画了一条下限,创作者的上限,就将会是平台的上限。
7数据驱动自媒体迭代
站在自媒体的角度,该如何以更结果导向的方式选择平台,更数据驱动的方式来面对不同平台运营呢?
“选择大于努力。”在多平台运营时代,不同的平台有着不同的分发规模、处于不同的发展阶段,自媒体首先面临的就是平台选择问题。
因为每个平台的投入都需要牵涉到运营人力,所以自媒体更应该理清投入产出比的账,选择那些切合自己品牌调性,选择符合长线商业化变现诉求的平台。要区分清楚哪些平台是叫好不叫座、哪些平台是叫座不叫好。
对于电商导向的自媒体,那么微博微信基本上是必选项。考虑到目前大多数平台相对封闭,不提倡向微博微信导流、且没有很好的电商支持,那么其在其他平台更多的在于曝光和品牌建设的贡献,而不会对电商的销售转化有太大的贡献。
但对于承接品牌广告的自媒体而言,其利润更多的和内容的传播量有关。在传播量导向的角度来看,就应该更多的选择和自己品牌调性相符的、哪怕是一些垂直类的内容分发网站。通过汇集全网各平台的流量,来实现自己对广告主的全网阅读量(播放量)的承诺。
在自媒体确定了自己选择的平台之后,就需要深究不同平台的分发特点,来进行针对性的运营从而提升自己在相应平台的曝光量。常见的三种平台:编辑分发、订阅分发和算法分发平台。
对于编辑分发平台,最快速的方法一定是维系好和平台的关系。因为在这样的平台上推荐位置都是人工分配的,更好的编辑关系能够保证自媒体有更好的流量倾斜。在编辑分发的平台上,往往更频繁的会有官方活动,积极地配合官方导向,就能从流量倾斜政策中获取红利。
对于订阅分发平台,做粉丝是不二法门。以微信为例,由于其是一个规定行业下限,而非设定上限的开放式环境。所以在这样的平台上进行运营,首先需要保证自己有足够高的敏感度,对于一些新的传播形态可以及时跟进,从而最大化的获取时间差的红利。
对于算法分发平台,尽管平台关系维护和粉丝数积累都需要,但是最需要投入的还是对于内容的包装。因为你的内容不仅仅要抓住人的眼球,同时也要能够对机器算法的胃口,通过研究过往一段时间的平台热门关键词,能够给内容的标题封面包装提供一些借鉴。
在我看来,多平台运营卓有成效自媒体品牌非二更莫属,细细观察,其在不同的平台上都有不同的运营策略。比如,在头条上的分发,二更就全面的在使用双标题、双封面的方式进行自己的内容包装。一些视频内容能够在非常短的时间内就获得了上百万的曝光量。
因地制宜精耕细作,自媒体的多平台运营策略,本质上还是一个依平台而细化,数据驱动、目标导向的。过程。
他山之石可以攻玉,将数据分析指导内容生产做到非常极致的,非BuzzFeed莫数。
员工总数逾千人,拥有全球新闻团队、视频制作工作室、尖端数据运算中心和内部创意广告机构,每月全网超过50亿次阅读——这就是BuzzFeed,怎么看都是一个庞大的媒体集团。
然而,当深入了解BuzzFeed的工作流程后就会发现,与其说它是一家媒体公司,不如说它是一家科技公司:“数据驱动内容创作”,这是BuzzFeed给自己贴上的标签。
在这家公司的内容创作和分发过程中,反馈闭环(Feedback Loop)是出现频次最高的术语:通过将市场环境和读者反馈数据尽可能的量化和结构化,及时反馈给运营人员、内容编辑,从而构成了辅助创作的一个闭环。
由于很早就树立了“将内容分发到用户常驻的平台,而非吸引用户到自己的平台看内容”的思路,YouTube、Facebook,Twitter、Vine等一众平台都成为了BuzzFeed的战场。
为了更好的理解用户反馈,BuzzFeed追踪收集并汇总了各个平台上的阅读传播和互动数据。比起阅读量、分享量这些结果指标,其更关心内容分发和传播的过程。
如果只看终态数据,那么报表展示给你的无非是一篇内容从不同的平台渠道上获取了多少流量而已。
但是深究下来,这些流量是如何来的呢?是通过Facebook或Twitter上的分享,还是通过邮件的传播?哪些节点带来了更大的辐射量和扩散量?只有深入分析传播路径,才能给出这个问题的答案。
不止于结果, BuzzFeed开始探究一篇内容的传播轨迹,他们开了一套名为Pound(Process for Optimizing and Understanding Network Diffusion)的系统,通过给同一页面的不同分享追加不同参数的方式,来追溯内容在网络上的传播过程。
通过这套系统,人们意识到:传播并不是一棵简单的传播树,而是一片密集的传播森林。每一次分享都构成了一棵新树,如果一个人的社交好友很多,那么这个节点的一度关系触达就会很广。如果内容的质量一般没有引发进一步的传播,那么就会止步为一棵低矮的树;如果内容引发了大量的传播,就会变为一个繁茂的大树。
由于社交传播对于内容的影响力贡献巨大, BuzzFeed在衡量内容价值时,会更看重社交分享所带来的阅读量,并以名为“病毒传播提升系数(Viral Lift)”的指标来衡量这一过程。
对于粉丝已经超过百万、内容阅读篇篇10W+的自媒体大号来说,这一衡量指标的制定不难理解:如果一篇内容的阅读构成主要来自于自己的粉丝,那么就意味着粉丝们更有可能是基于惯性打开的,但是由于内容并没有触及到它们的兴奋点、没能引发认同,从而失去了进一步扩散传播的可能,也失去了触达更多潜在粉丝的机会。
对于BuzzFeed而言,在相近的总阅读量下,一篇“病毒传播提升系数”更高的内容,因为收获了更多的社交传播而变得更有价值。有了技术追溯的支持,内容团队才能够总结出不同平台之上的内容偏好和病毒传播模式。
人们往往会夸大BuzzFeed的内容三把斧“清单体、短视频和小测验”,却忽视了在这些内容背后更深层次的数据支持。
具体到我们日常的内容阅读分析和粉丝分析过程当中,有哪些可以供分析注意的数据?
对内容分析来看,可以分为列表页的一次打开(点击决策)和进入详情页的阅读(消费体验)两部分。
一次打开是指不依赖于社交传播和搜索传播所带来的阅读量。对于微博微信等粉丝分发平台,是指粉丝带来的阅读量;对于头条、快报等推荐分发平台,是指经由推荐带来的应用内阅读量。
影响内容一次打开率最直接的因素有两个:活跃粉丝量和内容包装。
无论是粉丝分发平台还是推荐分发平台,活跃粉丝量都会影响内容展示的基本盘,只是传导系数不尽相同。对于粉丝分发的平台,自媒体有多少活跃粉丝就意味着有相应比例的基础展示量;对于非粉丝分发的平台,活跃粉丝量则会被视作自媒体在平台上的贡献程度和受众影响面,从而影响分发权重。同样的一篇内容,10万活跃粉丝的账号发布一定比1万活跃粉丝的账号发布会获得更大的基础展示量。
内容包装影响的是从展示量到阅读量的转化过程,更好的标题和封面图就像是更精致的产品包装一样,有助于促成转化。比如在头条号平台上,就支持了一个非常酷的双标题双封面功能,能够给创作者对内容不同包装的机会。
对于标题,我习惯于引用咪蒙的观点:“不能在一秒钟看明白的标题,不适合传播,不是读者理解不了,而是他只能给咱们一秒钟。”
在咪蒙的工作方式中,她会把当天写好的内容发出来,交于自媒体小组的员工开始取标题。15-20分钟内,每人至少取5个标题。这样,每一篇内容背后,都有近100个标题!咪蒙随后会从中挑出5-6个标题,放到3个由用户顾问群里投票(每个顾问群都有人负责统计票数)。
咪蒙会参考最终的投票结果,决定用哪一个标题。这种方式,其实就构建了一个最朴素的AB系统来验证标题对于内容一次打开率的影响。
为了便于比较,我们通常计算一次打开率而非打开量。
1、对于粉丝分发平台,一次打开率=阅读量/粉丝量
2、对于推荐分发平台,一次打开率=应用内阅读量/推荐量
一次打开率对于不同分发模式的平台有不同的意义:
在粉丝分发的平台上,一次打开率能比阅读量更好地衡量自媒体账号的价值。为了保证更高的一次打开率,需要更科学地获取精准粉丝、重视粉丝群体的互动维护,使得自身始终能够保持较高的粉丝触达率。
对于推荐分发平台,一次打开率考量了自媒体对平台分发特点的认知和对内容包装功力。一次打开率(推荐点击率)高就意味着具有成为爆款的可能。甚至会收获比粉丝分发平台更大的阅读量。
如果说一次打开代表了上门推销人员成功敲开了用户的房门,那么阅读体验衡量的就是用户是否会为这次推销最终选择买单。
用户是带着对作者品牌和对标题封面的认知预期打开内容的,只有实际消费体验与预判一致、甚至超出预判,才算得上是好的阅读体验。我们之所以抵触标题党,并非因为它骇人听闻,而是因为用户抱着骇人听闻的预期,点击进入详情页之后才发现内容平淡无奇。
想要衡量消费体验,内容的消费比例是一个重要的指标。对于图文来说这个指标是平均阅读进度和阅读速度;对于视频来说是播放进度和播放时长(因为用户会有快进的行为,所以100%的播放进度并不意味着100%的播放时长)。平均消费比例越高,代表用户的认可度越高、消费体验越好。
除了内容消费比例指标以外,内容是否引发了读者互动也是一个常见的考察角度,如评论、点赞、收藏、转发等,这些指标的横向对比通常用于组织内部考核不同编辑的创作能力。其中,个人建议需要额外关注的是评论和转发两个指标。
评论扩展了内容的深度,更多的用户评论给正文提供了不同的视角分析和信息补充,可以有效的引发围观用户的阅读兴趣,提升用户在内容页的整体停留时长。
促进评论的提升算是有一些技巧性的部分:选题有冲突性或者有代入感,在正文中留有悬念,主动引起讨论、投票,在评论区中带节奏等等都是行之有效的方式。
转发扩展了内容的广度,更多的转发能够带来更多面向潜在受众的曝光,这一点对于以粉丝分发为主要模式的系统尤甚。对于转发指标,我们可以套用BuzzFeed的病毒传播系数的计算方式:Viral Lift = 1 + 传播阅读量 / 一次阅读量。
粉丝数,历来是我们衡量自媒体优劣的重要数据指标。
但对于自媒体而言,片面的追求虚高的粉丝数,除了忽悠投资人和广告主以外,对自身成长毫无意义。想要可持续发展,只有持续获取精准的粉丝才有价值。
那么,什么是精准的粉丝?
我想,应该是指能够给自媒体带来切实变现价值的粉丝。
而粉丝增长的分析,就是围绕粉丝的变现价值算的一笔账:假如一个粉丝能给自媒体带来5块的净利润,那么花低于5元的成本来购买这个粉丝就是划算的。
为了更好的说明粉丝的分析,首先引入三个概念——LTV、CAC和ROI。
1、LTV(Life Time Value):生命周期总价值。一个粉丝从关注你的那一天开始到取关或者脱离平台为止,能够带来的收益。通常按渠道来计算,如果某个渠道或某个平台的用户不精准、付费意愿差,那么这个渠道的用户LTV就相对较低。
2、CAC(Customer Acquisition Cost):用户获取成本。同样跟渠道有关,自媒体需要持续的发现低价、优质的渠道,抢占红利期。比如2015年初,微信广点通渠道的公众号涨粉,单个用户获取成本只有1-2块钱。
3、ROI(Return On Investment):投资回报率。计算公式为(收入-成本)/成本。应用于粉丝增长场景就是(LTV-CAC)/CAC,衡量的是:你从一个粉丝身上挣到的钱,是否能够覆盖获取这个粉丝的成本。
通常,自媒体应该做ROI>1的事情才能够保证业务的可持续发展。
在15年初,微信朋友圈集赞的路数还很火热。我亦不能免俗搞了三场集赞有礼的活动。三场活动下来,表面上看起来一片光鲜,各种指标在活动日都有显著的提升。但是兴奋过去之后的分析,却让人笑不出来了:三次活动中,发起活动的老用户重叠度越来越高,带来的新用户越来越少,同时,新用户的次日留存情况也越来越差。
于是,开始反思用户为什么要参加集赞有礼的互动?唯利尔。
老用户发起活动,他所带来的新用户无非是看一眼品牌广告,帮朋友支持一下。如果实物奖品价值还不错,那么这个新用户也会发起,但目的在于奖品而非公众号。有的薅羊毛用户甚至自建了微信群开始互相点赞,完全达不到拉新的作用。
想要提升用户增长的ROI,就必须降低新用户中非精准用户的比例,从而拉升渠道用户的LTV,降低用户获取成本CAC。
由此入手,新一期转发集赞活动将奖品设置为了音频的部分章节收听权,每个用户只需要拉5个用户就能获得。因为是虚拟产品,CAC得到了显著降低。而音频内容跟微信账号捆绑只能自用,用户如果不是真有需求就绝不会发起活动,从而提升了新增用户的精准程度。
在后续的此类活动中,我们都有意识的对礼品的形态进行了控制:实物礼品用于鼓励已有的活跃老粉丝,虚拟礼品用于激活和拉新。
运营微博、微信这样的平台,我们很容易沉迷于追求短期粉丝数字的飙涨而举办各种活动。某些活动拉新从CAC的角度看或许还不错,但深究其所带来的真实活跃粉丝,就往往会发现ROI远远小于1,充其量只能算是一次次展示广告曝光,做了一笔又一笔的蚀本生意。
通过数据分析的方式,得以让我们更加清醒的审视内容创作的消费性好坏,粉丝积累的性价比高低,从而以更经济的方式提升自己的增长速度。