关于留存率计算

日活、新增、留存作为常规互联网App的三个核心指标,衡量着一个产品的价值。日活描述着用户体量,体量大也可能是日积月累的结果,并不表现产品未来前景,一年做到日活一万肯定跟一个月做到日活一万不可同日而语,所以此时要看新增。新增描述着产品吸引力,新增越大,则产品的增长性越好,但如果有人通过花钱买量,也可以把新增买上去,此时就要看留存。留存描述着产品的的质量和刚需性,花钱很容易买来新增,但是很难买来留存,刚刚新增越大,留存率下滑得越厉害。

三个核心指标相互制衡,其中最值得讨论的就是留存率的计算,别的指标都好用钱来操纵,唯独留存率不好操纵,一些公司在给资方爸爸看数据时,就会选择不同的计算方式,从而让数据看上去更亮眼。

通常最严格的计算逻辑为:用户于第0日首次登录,于第N日再次使用App,即表示该用户的第N日留存。N等于1,就是我们常说的基于用户ID的新增次日留存率。为什么它是最严苛的呢?首先它只考虑有用户ID的,也就是没注册的游客不考虑,其次它是严格第N日再来,而无论N日之前是否有来,N日之后是否还来。

为什么留存率的计算还可以算出更亮眼的结果来呢,因为维度不同!

1. 基于设备,还是基于用户ID?

有些产品形态用户的注册率不高,用户都习惯以游客身份使用,来之即用,即之即弃,通常如:新闻App、下载站App、小游戏类App、阅读类App、小视频类App。你可能天天刷着快手、抖音,但可能你从来没有注册登录过,所以这类App如果按用户ID来计算留存率显然就有点不合适了,很显然基于设备能算一个留存率,基于用户ID也能算一个留存率,两个值一定不等,可能还相差巨大,比如下载站类的App,用户可能就是为了下载某个资源才下载App的,资源下载到了,App也就可以卸载了,所以基于设备的留存率可能低得离谱。

2. 新增留存,还是日活留存?

花钱买量之后,发现新增的用户全是各种积分墙的游戏任务导量进来的,用户压根就没有心思了解下载的是个什么App,就直接卸载了,这时新增留存肯定是惨不忍睹,于是有人搞出个日活留存来,就是第0日来过,在第N日再次来过就算留存。买量的新增用户留不住,但是日积月累留下来的老用户还是挺忠实的,所以这么一算下来,数据就好看很多。很显然,日活越大,新增越少,新增的低留存率影响就越小。

3. 留存率还有两种算法?

一种叫rolling retention,它的先要定义一个时间窗口,比如180天,第0日还是定义用户第一次来,次日留存就是指在第1日至180日区间内又来过就叫次日留存,N日留存就是指从N日至180日区间内又来过,就叫N日留存,这听起来真真切切就是留存的语义化表达。很显然这种计算方式,跟观察的时间窗口大小有关,1日至180日的留存率数值为下降序列,但数据显然会偏大。这种让人心里大爽的计算方式很多大的三方计算平台都会采用。

另一种叫retention,或者叫return rate,就是我们最开始说的最严苛的计算规则。N日留存,就是用户在第0日第一次到来,在第N日再次到来,无论他在0日至N日中间是否来过,也无论他在N日之后是否还来。很显然这种算法的数值未必严格递减,比如一波用户第0天来了,恰好第1天都不来,又恰好第2天都来了,就会出现2日留存比次日留存还大的情况,但数据量越大,越不容易出现非递减问题。这种严苛的算法,相比于rolling retention数值要小得多。它有一种简便算法,就是记录每个用户的首次到来的时间戳,这样用户任何一天来,都知道他贡献的是第几日留存。

综上,将上面的各种维度排列组合一下,可想而知就可以弄出很多种留存率结果来。有的公司会在资方报表上使用亮眼的算法,而在内部沟通时使用严苛算法。

发表于 03月13日 19:37   评论:0   阅读:1187  



回到顶部

首页 | 关于我 | 关于本站 | 站内留言 | rss
python logo   django logo   tornado logo