做了10年的数据相关工作,做过数据分析、数据运营和数据产品等工作内容,感觉自己最满意的,并不是自己掌握了多少数据分析的技能和多少大数据技术,而是碰到任何问题时,都会联想到如何用数据驱动的方法去解决,我相信这就是一个人具备数据思维能力的体现。

那数据思维是什么?简单来说,数据思维就是关于事物认知的一套思维模型,一个具备很强数据思维的人,最重要的是要考虑到一个事物从起因到结果的发展过程中所产生的数据流,而这个数据流其实就是记录这个过程的最好证据。

今天我通过3个和数据相关的例子来举例论证数据思维在我们日常生活中所产生的重要商业价值。

从行为数据预测学生考试成绩

去年,回母校参加数学建模二十周年活动,跟老师聊起了现在的大学生一些现象级的问题,就是现在的大学生不好管理,沉迷各种网络游戏,学习懈怠现象很严重。因此,我也就马上想到,大学里如何通过数字化和数据驱动方法论,来解决这些个问题。在大学里,大学的考试基本上一个学期只有一次,所以如果一位同学在暑假迷上了网络游戏,开学后即使完全不学习,最早也得半年后等到学期期末考试成绩出来,才能够看出一些端倪。也就是说,考试作为对学生学业发展的一种评估手段,是静态和滞后的,并不能实时发现学生学习行为的异常。

那么,有没有可能通过收集学生在学校日常被动积累的数据,对这些数据做分析,早期发现学生学业发展中的异常情况,并进行预警和干预。我们一下子可能就会想到的与学生成绩有关的数据,包括学生历年的考试成绩、选课记录、教材与参考书的图书馆借阅记录等等。这些数据固然有用,但是要做到精确的成绩预测,并且同时发现学习行为的异常,还远远不够的。在寝室待得越久,成绩是否越差?进图书馆的次数越多,成绩是否越好?去水房打水的次数越多,成绩是否越好?吃早饭越多、洗澡越规律,成绩是否越好?食堂打卡记录是否可以定位孤独人群以及他们心理状态的变化?这些数据维度,对于预测学生考试成绩,都会有很大的帮助。

但其实遗憾的是,据我了解,绝大部分大学,这样的数据是没有被收集的,因此也就无法支持这么详细的研究。所以说,当前大学校园要建设大数据的一体化平台,其建设的宗旨是为了更好地辅助教育,最大价值的发挥教育数据的外部性,因为学生的行为数据蕴含着大量有价值的信息,而且这些数据是实时的,能够及时抓住当前学生的异常问题,避免“亡羊补牢,为时已晚”的悲剧。

有人说,这么隐私的数据被收集和使用,会引发巨大的争议。但我认为,个人信息的适度开放,会帮助更好实现教育的宗旨。

通过分析小区垃圾实现线下广告精准投放

大家每次坐电梯的时候,都会传来各种广告声,这是分众公司的广告商业模式。那投放广告,广告主比较关心的一个问题,就是如何确保自己的投放广告触达到了自己的目标人群。但是线下广告和线上广告不一样,线上用户行为的数据很丰富,而线下广告能够收集到用户的数据是非常有限的。那么,线下媒体是如何做到精准和细分,让投放广告的广告主更有效锁定自己的目标受众,这对分众这样的广告公司来说是一个巨大的挑战。

传统的方法,就是在和物业签约的时候,将物业提供的所有资料都录入到数据库当中去,同时还会向物业公司问更多的问题来补充为获取到的信息。但是这种传统的方法所获取到的信息维度不够丰富、不够具体和准确、也无法做到及时更新。

相比传统的方法,分众在全国的小区很早就建立了自己的垃圾分析网,通过对垃圾的分析来研究小区居民的用户画像和品类/品牌偏好。他们给小区卫生管理员配一把扫描枪,看见垃圾里的条形码就扫,扫到的数据会实时同步到数据库。这样就可以知道这个小区主要喝什么水、喝什么酒、用什么油.....通过这些数据,关联这些产品的价格信息,就可以洞察这个小区消费者的品类偏好、品牌偏好和消费水平。这种方法的变革,相比传统方法,很大程度上是在做通过大数据库积累形成的变革,随着这些垃圾数据的积累,基本上可以对小区居民做到精准的细分和洞察。

像播天气预报样实时发布CPI指数

去年,涨幅最大的食物是什么,大家肯定会异口同声的说“猪肉”。因此,去年咱们政府的官员,经常会给大家解读一个重要指标—CPI,居民消费价格指数,它是作为一个反映通货膨胀的重要经济指标。正是因为CPI的重要性,快速而准确地计算CPI指数,对于国家宏观决策有至关重要的价值。遗憾的是,现实中的CPI指数,是通过实地调研的方式获取数据,然后再计算和对外发布,在实时性和准确性方面往往都不尽人意。

为了解决数据的实时性问题,阿里巴巴集团研究院发布了网络零售价格指数(ISPI),它综合反映了淘宝和天猫平台的网络零售交易商品和服务的一般价格水平。虽然淘宝和天猫的线上消费只是整个国民消费的一部分,但从抽样的原理上,来看,阿里全量采集的这些数据,比国家统计局通过抽样的方式获取到的数据要多得多,数据结果可能会更准确。因此,ISPI指数是CPI指数的重要补充,能够快速和准确地提供价格信息,为相关决策部门提供决策依据。

更有意思的是,国外有一家叫做Premise的初创公司,通过付费众包模式将大宗日常消费品的价格采集任务分派至当地居民身上,全球700多人须每日到特定便利店或者超市采集至少多250种特定商品的图片和价格信息,每采集一样商品可获得报酬5-15美分。700多名当地员工就能掌握全球的CPI指数变动信息,他们利用这些数据和许多消费品公司建立了长期合作关系,同时他们还为客户提供定制化的数据采集服务,比如自家感兴趣的产品或者竞品。当然,他们的采集也有不足之处,比如众包人员在数据采集过程中犯错误而导致数据的不准确,这个是需要他们要规避的比较突出的问题。

数据思维如此重要,那么如何提高数据思维,根据我的经验给出3条建议:首先,基础知识是思维能力的基础。数据领域涉及到的基本知识,大家要掌握扎实。其次,日常生活和工作中,要时常关注所看到的数据,对数据保持足够的敏感性。最后,多思考数据背后的东西,把数据转化成知识,让数据产生真正的价值。

点赞(5) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部