作者介绍 @王志杰 明略科技的大数据架构师; 毕业于北京大学计算机科学与技术专业。 大家好,我是来自明略科技的王志杰。 今天,我和大家分享的主题是《比你更了解你,浅谈用户画像》。其实,前面几位老师已经结合自己所在的行业和企业内部的一些用户画像和标签的应用,给大家深入地去聊了一下具体的实现,以及在各个行业里的应用。 到了我这块呢?我觉得会是一个从深到浅,回过来,从一个高层次的角度去重新了解一下画像。也是借这个机会,和大家分享一下,明略科技对于画像的认识,关于到底怎么去理解画像?为什么需要它?以及在这个建设过程中我们的一些方法论,等等。 01 什么是用户画像? 首先,我们看一下用户画像的定义,什么是画像? 我们现在看到的是百度百科上面的用户画像的定义。用户画像又称为用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。 英文来讲的话,就叫User Profile,或者User Personas。其实更深入更专业的来说,User Profile和User Personas是有一些区别的,但是因为我们今天要浅谈用户画像,深入的内容就不去了解,就把它都当做是用户画像。 回过头来,我们看上面百度百科的用户画像的定义。其中,我把两个部分标红了,是我认为的重点。 第一个是“勾画目标客户”,它表达了用户画像的本质,也就是我们对目标客户的一种勾画,一种描绘。在这里的勾画描绘,肯定不是指我们平时在马路上看到的,马路边儿上给你快速地画一幅肖象画儿。肯定是要比这种肖像画要丰富地多。 我们的用户画像多在什么地方呢?其实就是标红的第二个部分,就是属性、行为。其实画像是对我们的更多的属性、行为的勾画。 换一种视角再重新看画像的定义,我们来到一个更技术化的定义。 它是说用户画像可以更简单地理解成是海量数据的标签,根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,形成了一个人物原型(personas)。 这里用到的是一个叫personas。在这个定义中,引出了一个非常重要的概念——标签。就是刚刚一直在谈论的画像、标签,默认地把这两个关键词都带出来了。 如果对一些之前没有理解过的同学来说,可能不太了解为什么说着画像,突然扯到标签来了。其实在这个定义里面,之所以摘选这个定义,就是要给出来标签在画像中的一些作用,或者和画像之间的关系。 我们之所以要有标签,其实帮助我们将用户的一些属性可以理解为,标签对用户各种数据的一种提炼总结。可能就是用一个词或者是用一个短语,来表达用户在某个方面的一项特征。 我们的用户呢?刚才提到的属性、行为,其实是有各种各样的特征,那么我们也就需要有海量的标签来去完整地描述我们的用户。 用标签来描述用户的一个好处,它可以用一种可视化的方式,把用户的特征表示出来,让我们更加便捷、更加清晰地来了解我们的用户,这个也是我们用户画像的一个意义所在。 所以说呢,用户画像就是把我们用户相关联的数据去进行可视化的展现。一句话总结一下用户画像的特点,就是把用户的信息去做一个标签化。 到现在为止,花了两页的PPT来对用户画像进行多种的定义。其实更多的是一种概念上的东西,大概是不够直观。下面举几个例子来实际地看一下。 首先举这个例子,我们看到的是一个非常形象的画像,完全是字面意义上的画像。 中间我们可以看到是一个人物的画像,它其实是用各种标签来构成的,通过各种标签来构成这样一个画像。这些标签比如我们看到像文静、可爱、善解人意、活泼等等,它都是对我们的用户的某些属性的一个描述。 在这张图上,我们也可以非常直观地发现,这些标签被分成了几个类型,有基本属性类、有消费购物类、还有社交类。其实还会有更多更多的分类,这里面就没有一一地去列举。 之所以我们会去对标签分类,一个是便于对标签的管理,另外一个重要的原因呢,就是说我们在不同的场景中,这些标签可以帮助我们去实现不同的目标。场景和目标也是非常重要的,后面我们会再提到。 具体到这张图上来看,比如说我们的基本属性类,右边蓝色图表,像年龄、性别、所在的区域,其实都是一些比较通用类的信息。可能在我们的多个场景中,都会去用到它们,通常会再去配合一些其他的标签进行使用。 像消费购物的标签,就是左上角黄色图表,可能在电商场景中会用的比较多,我们可以看到拟合的这个用户,她在消费方面的一些偏好,比如第一个标签叫消费偏好领域——服帽,可能她相对来说,购买服装类的物品会比较多。我们进行一些推荐或者促销的时候,肯定会挑一些服装、鞋帽等等这些品类推送给她。 但如果我们不考虑这些内容,天天去跟她推荐一些3C电子类的产品,告诉她,USB接口的数据线,它是5安的,支持快充怎么怎么样的好。她也可能会慢慢地不感兴趣,也就起不到促进购买的作用了。 再有呢,就是说,比如偏好价格区间。虽然我们偶尔也会去购买一些非常需要的东西,不太在乎价格。但大多数的购买,其实还是会在一个范畴区间内,这个区间可能问你的话,你可能不会直接的把它量化出来,多少钱是我的一个上限,多少钱是我的一个下限。你自己可能都没有办法去把明确的区间画出来。 但是,通过用户画像可以帮助你去把它框定在一个范围之内。其实也说就是画像比自己更了解自己。通过对于偏好价格之间的标签化,我们就可以在后面进行推荐和促销的时候,针对这个范围进行,这样的话效果也会更加的显著。 最后我们来看网络社交类的标签。它其实都是和社交网络相关的,这里举的几个例子,都是和微博相关的,左下角紫色的部分,比如粉丝数、关注数、互动数等等。在我们去进行一些社交语境分析的时候,其实这些网络社交的一些标签,对我们分析都是非常有帮助的。 刚刚上一页,我们是结合一个画像的实例,列举了用户画像在营销、预测、分析等等场景中的运用。其实,还有一个非常早就开始应用画像来处理日常业务的领域,那就是金融领域。 在金融领域里,最常见的一个场景应该就是信用评分的画像。在我们的这个例子中,可以看到它的这些标签,都是和个人信用相关。 这些跟个人信用相关的都包括什么呢?比如你在我这个平台注册的一个年限,你是不是中间有修改过注册信息,你是不是在其他的平台有过逾期的行为,还是说你一向都是表现良好。 也包括一些你的个人信息,比如说你的婚姻状况、有没有小孩儿。再有,就是在社交媒体的一些表现,比如说你的粉丝数,在社交媒体上的一个活跃度,等等。 这一系列的信息,都可以综合起来去帮助我们判定用户的信用评分以及信用等级,来辅助我们的业务部门去做出决策,而这也提出了一个非常重要的概念,就是辅助决策,后面我们就会提到这一点。 我们除了可以对单个用户进行画像之外,也可以对群体进行画像。比如说在我们这个例子里面,看到的就是微博上某个特定人,他的粉丝情况的分析。 在我们第一阶段的时候说过,画像是一种可视化的展现,但是展现的形式不是单一的。在我们这个例子里,和对单一用户画像非常的不一样。 刚刚的例子是对于单一用户的画像,其实我们更多的是把每一个属性进行一个分类和排列,来帮助我们去了解某一个单独对象的信息,比如说性别是什么、年龄多大、来自哪里等等。 针对群体的画像,在展示上更多的是将单一标签类型汇聚在一起,然后去展示统一信息。 比如说性别,每个单元各占多少比例;比如说我们右下角的一个地区,每个省份它所占的比例;或者说每个省份的热度是多少。相当于是以省份为类别,去统计它所占的比例。 还比如说我们去处理一些连续的值,或者说是比较多的数值时,我们也可以进行分段,比如右上角的年龄,可能会针对一些比较典型的年龄段去进行一个划分,这个具体怎么去划分呢,是和业务相关。 未完待续……敬请关注《比你更了解你,浅谈用户画像(二)》
发表评论 取消回复