草帽小子

数据产品经理一枚;

用户画像、埋点、指标体系、BI、广告投放等系列作者;

《大数据实践之路:数据中台+数据分析+产品应用》作者;

“数据人创作组联盟”成员。


    

      标签体系是整个用户画像建设的地基,不打好地基,摩天大楼就不可能平地而起。草帽小子在做调研及规划过程中,就深深认识到标签体系的重要性,接下来草帽小子会重点介绍标签体系。


01 标签分类


不同公司的标签分类有所不同,目前市面上有三种常用的标签分类方式:按用途分类,可分为基础信息、用户行为、业务偏好、场景标签;按统计方式分类,可分为事实类标签、规则类标签、预测类标签;按时效分类,可分为静态标签、动态标签。



1.1 按用途分类


按用途分类的标签,可分为基础信息、用户行为、业务偏好、场景标签。通常面向产品/业务人员,分类时需要根据实际的业务需要进行类别划分,以便适配业务人员在通用场景和定制场景下标签的使用。


1) 基础信息标签


基础信息标签,是用于描述用户的基础属性,包含自然属性、社会属性、业务属性等,如性别、年龄、常驻城市、RFM、会员等级等标签。


年龄

人们在一生中购买不同的商品和服务,在幼年时吃婴儿食品,在发育时期和成年时期吃各类食物,在晚年吃特殊的低热量食品。人们对衣服、家居和娱乐等的喜好也跟年龄有关,这也就是为什么年龄是画像中常用的标签。


职业和收入水平

职业影响一个人的消费模式,如蓝领工人通常会买工作服,公司的董事长则会买名牌服装及高端产品。不同职业的人群收入水平不同,针对高收入水平的消费者,可向其推荐更优质的商品,促进商品转化率。

 

2) 用户行为标签


心理学家马洛斯认为,在某一特定时间,人们会受到特定需求的趋势。他的理论是,人类的需求是按层次排列的,从最迫切的需求到最不迫切的需求。按重要程度排列,这五种需求分别是:生理需求、安全需求、社会需求、尊重需求和自我实现需求。消费者总是先寻求满足最重要的需求,当最重要的需求得到满足之后,他就会寻求满足下一个最迫切的需求。

 

用户行为类标签,主要通过洞察用户在最近一段时间内的各类行为,如浏览、搜索、收藏、加购等,进一步提炼出用户的需求。用户搜索或加购某一类型的商品频率越高,其消费需求就表现得愈加强烈。提炼出的常见标签包括近7天上网时段、近30天收藏品类、近30天消费频度等。运营者可通过组合圈选择有多种行为的用户,为其定向推送相关商品。

 

3) 业务偏好标签


业务偏好标签,用于描述用户的偏好业务内容,根据公司业务不同,划分不同的分类,通常电商行业业务偏好类标签包含运动户外、数码家电、食品保健等,其他行业的业务偏好标签根据实际业务而定。

 

一般情况下,以上这3类标签即可满足常用的标签使用需求,因为其已描述who(基础信息)do(用户行为)what(业务偏好)的整个过程,该用户的行为合集构成了整个用户画像。

 

但随着标签的使用,业务人员发现,经常会有些同类似的活动,使用到了类似的标签组合,类似的人群包。于是这类标签组合便可沉淀下来,针对特定场景使用。


4) 场景应用标签


场景应用标签,用于特定场景下使用,由业务使用经验积淀而来,例如618/双十一活动标签,双十一预付定金人群、双十一下单人群等。标签建设初期可不设置此分类。


1.2 按统计方式分类


按统计方式分类的标签可分为事实类标签、规则类标签、预测类标签。与按用途分类不同的是,按统计方式分类的3类标签通常面向研发人员,意指标签是按何种方式计算而来,其复杂程度、产研成本由低至高。


1) 事实类标签


事实类标签是用户画像最基础、最常见的标签,通常是基于原始数据清理后的归类,用于描述客观事实。例如,姓名、会员等级、终端类型、购买次数、购买金额等。


2) 规则类标签


规则类标签,顾名思义,是基于确定的规则而产生。与事实类标签不同的是,规则类标签拥有更多的业务属性,其业务规则需与业务人员共同制定。例如,将“活跃用户”标签可定义为,“过去30天发生a行为x次”&“过去30天发生b行为x次”,进行综合评定。


用户活跃度标签


实际业务场景中会涉及根据用户的活跃情况,给用户贴上高活跃、中活跃、低活跃、流失等标签。那这个过程中高中低活跃度对应的时间范围是如何划分的呢?


在这里,靠拍脑门可行不通,标签讲究定义有依据、建设有方法。


首先划分用户的流失周期,运用拐点理论:X轴上数值的增加会带来Y轴数值大幅增益(减益),直到超过某个点之后,当X增加时Y的数据增益(减益)大幅下降,即经济学里面的边际收益的大幅减少,那个点就是图表中的“拐点”。



比如图中流失周期增加到5周的时候,用户回访率的缩减速度明显下降,所以这里的5周就是拐点。我们可以用5周作为定义用户流失的期限,即一个之前访问/登录过的用户,如果之后连续5周都没有访问/登录,则定义该用户流失。


划分完流失周期之后,初期可根据根据四分位数,将用户的活跃情况划分为高中低,后期根据数据情况更新规则。


四分位数

也称为四分位点,是指在统计学中把所有数值从小到大排列并分为四等分,处于三个分割点位置的数值。

如历史数据,选择近1个月访问APP次数在0-8之间,则取3/4分位点为6、1/4分位点为2。

高活跃用户:近1个月访问APP次数在[6,8]区间的用户

中活跃用户:近1个月访问APP次数在[2,6]区间的用户

低活跃用户:近1个月访问APP次数在[0,2]区间的用户


RFM标签


根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标:最近一次消费时间、消费频率、消费金额。


最近一次消费(Recency):指用户上一次购买的的时间,一般上一次消费时间越近的顾客是质量更佳的顾客。最近一次消费是维系顾客关系的一个重要指标。


消费频率(Frequency):顾客在限定时间周期内消费的次数。消费频率高的顾客,也是满意度最高的顾客。根据这个指标,可以把客户分成几等份,相当于划分了一个忠诚度的阶梯。


消费金额(Monetary):消费金额时产能最直接的衡量指标,也可以验证“二八定律”,公司80%的收入来自于20%的顾客。


我们在设计RFM标签时,可根据二八定律来进行标签分级。


二八定律

二八定律又名80/20定律、帕累托法则,它是在19世纪末由意大利经济学家帕累托发现的。帕累托认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的。给一个公司带来80%利润的是20%的客户,按照这个原则,如果能把这20%的客户找出来,提供更好的服务,这对于公司的发展和业绩增长起到至关重要的作用。

R:如历史数据中80%的用户最近访问<90日为“近”,用户最近访问>=90日为“远”。

F:如历史交易订单量80%的用户订单量<10单为“低频”,订单量>=10单为“高频”。

M:如历史交易订单金额80%的用户交易金额<2000元为“低额”,交易金额>=2000元的为“高额”。



客户类型可划分为:


① 重要价值客户:R↑ F↑ M↑,消费金额、消费频次大且最近有消费的用户,则为优质客户;可倾斜更多资源、提供VIP服务、专属客服通道、个性化服务


②重要保持客户:R↓ F↑ M↑,消费金额和消费频次大,但最近无消费,需要唤回;可提供有用资源,通过续订或更新产品赢回他们


③ 重要发展客户:R↑ F↓ M↑,消费金额大,且最近有交易,但消费频次不高,需要重点识别;可交叉销售,提供会员/忠诚计划,推荐其他产品


④ 重要挽留客户:R↓ F↓ M↑,消费金额大,但消费频次不高且最近吴晓飞,此为最潜在有价值的客户,需要挽留;可采取push消息触达,回访等措施,来提高留存率


⑤ 一般价值客户:R↑ F↑ M↓,消费频次高且最近有消费,但消费金额较小;需要进一步挖掘,向上销售更高价值的产品


⑥ 一般保持客户:R↓ F↑ M↓,消费频次高,但最近无消费且消费金额较小;可向上销售更高价值的产品


⑦ 一般发展客户:R↑ F↓ M↓,最近有消费,但消费频次及金额较小;可按消费类型推荐其感兴趣的产品


⑧ 一般挽留客户:R↓ F↓ M↓,无消费的新用户;可开展活动,免费试用,提高客户兴趣,建立品牌认知度


3) 预测类标签


预测类标签,基于现有事实及规则无法得出,需要运用决策树算法、贝叶斯算法等进行数据挖掘与训练,得出标签预测结果。


预测类标签复杂度高、开发周期长、开发成本高,且需要算法工程师参与,通常此类标签的占比较少。


1.3 按时效分类


按时效分类,可分为静态标签、动态标签,方便业务人员在需求提出时做好时间维度的限制,同时方便开发人员在标签更新时,设置静态标签的更新时间更长,提升数据产出效率。


1)静态标签


静态标签通常用于描述固有属性,不随时间的变化而改变,如性别、身高、体重等。


2)动态标签


动态标签需要动态更新,来保持标签的有效性,如近7天购买次数、近30天加购次数等。


02 标签分级


随着标签的增多,当标签数量发展到成百上千量级时,业务方要从中找一个标签就会十分困难。所以标签在建设初期就需要进行分级分类的管理,就像整理电脑文件夹一般,分类清晰的标签更便于查询使用。标签常用的分级结构为:一级标签、二级标签、三级标签、四级…逐级往下分。



注意:建设初期要注意的是层级不必生搬硬套、划分过细,根据标签建设实际情况划分即可。如果公司只有几十个标签,则划分至二级足矣,过细反而累赘。

点赞(237) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部