作者介绍 “Claire,我来公司3个月了,你是第一个给我讲清楚这些图表到底是干什么的人。” “Claire, where do you learn your presentation skills? You did a great job!” “Your analysis and presentation is very insightful, Claire. I love the way how you presented the findings.” 以上来自我工作中同事、老板对我presentation的评价。在我近三年的数据分析生涯中,数据可视化和presentation一直是工作中的重要部分,present的对象包括但不限于公司内部技术和非技术人员、高管以及客户中的高管。正是这些经验的积累,本文我想针对“用数据说话”这一主题,分享给大家我踩过的坑和有效的用数据沟通的技巧,希望能帮你也在工作中清晰有效的呈现数据。 本文内容受众不只限于数据分析师,因为事实上,不管是金融分析师、产品经理、项目经理、运营专员、市场营销专员或是销售经理,在工作中都或多或少需要向同事、老板、高管、或者客户用数据来展示自己的业绩/项目成果、公司的运行现状或者客户的需求满足。众所周知,数据让你的statement(论据)更具说服力,量化结果也更容易让人留下深刻印象。 但事情没有那么简单,现实是没有良好的沟通表达,对方不一定完全理解你的意思,下面让我们来看看如何“用数据说话”。 作者注:
本文侧重点在于如何用数据更好的表达自己的观点,里面涉及的数据可视化建议与咨询公司的报告图表(更偏静态和需要阅读)有一定区别
请读者容忍作者中英混杂的文风
作者的工作经历都是to B(面向企业)的数据分析
这部分想分享的内容太多,所以会写成一个系列
(一)上下文的重要性
一次好的数据化沟通要从介绍需求背景/上下文开始,比如本次meeting的目标是什么,谁提出了这个分析的需求,需求方想实现什么效果。再者,不同公司、环境、职级的人对同样事物的认知和熟悉程度是不同的,比如说某公司第二季度revenue是$1M,很多人可能并没有概念这个数字的大小、反映的业绩好坏,但如果你加上与去年同期的对比、有没有达到我们的预期(OKR),就会更容易被人理解。
(二)knowing your audience is key(了解你的听众)
通常情况下,对不同audience做的dashboard都是不同的,比如面向公司内部市场和销售团队使用的dashboard,他们希望分析尽量细节(granular),这样他们可以选取对不同客户有效的信息进行pitch(产品推销)或者回答客户关于一些细节指标的提问。但如果dashboard是面向客户企业的非技术人员和C-level的高管来使用,就要更偏向战略宏观角度的分析,作图尤其要注意简单易懂,不仅一张图不要放太多内容,也切忌堆砌图表。
(三)a picture is worth a thousand words(一图胜千言)
有效的图表可以让听众更好的记住你的结论,而一个好的图是不需要使用者思考太多的。下面分享一个技巧和案例:
1. pre-attentive attributes。这是人类大脑对图表处理的一种潜意识表现,比如颜色的不同、深浅,线的长宽大小、方向,形状,2-D散点图等。正是人类的这种信息处理特质,我们应该在数据可视化的时候利用起来,用这些特点来highlight我们想突出的insights。颜色最容易被人们观察到,但不要使用过多颜色,会分散人们的注意力;尽量不使用倾斜的axis label,因为人们需要更多的时间来process,必要时使用缩写;去掉图表的边框而选择用空白来划分边界,因为边框会吸引受众的目光,而我们需要受众的注意力在图标的细节里。
2. 同样的数据,目标不同,选取的图表也应不同。比如我们有麦当劳不同地区不同月份的销售额,如下表(fake data)。
当我想知道哪个地区哪个月销售额最高,一个好的visualization是直接在上表highlight最大值,如下图:
当我想知道哪些数据达到了每月$100K的销售目标,用不同颜色的柱状条形图+目标水平线来展示。注:这里需要先unpivot上表。
(四)数据的粒度(granularity)
任何人都能给出一个数字化的结果,但是注意你数据的level of details/granularity 是保证你结果正确的重要前提。比如下表
同一个电影可能有多个类别,这里不同的类别被分在了不同行。如果要算每个制片厂制作电影的的平均票房,就不能只按制片厂group by算票房的avg,因为同一电影的票房数有重复计算,种类越多的电影,票房的加权也越重。正确的算法是先去重(de-duplicate),保证每个制片厂的每部电影只有一个票房纪录,再按制片厂算票房平均值。
另外,这一点在你需要写SQL进行table join的时候也尤为重要!
(五)actionable next steps
判断自己数据化沟通的成效之一,是在meeting或者presentation的最后,看audience能否带着你提供的insights进行一定的决策或者有清晰的下一步规划,这才保证我们的沟通是有效并能解决实际的问题。
数据分析师在做dashboard时的好习惯
理解你要解决的问题。
先自己想想你需要什么样的数据支持,再看你要从哪些database或者source table 中获取数据。
然后写SQL的时候,对你的结果有一个expectation, run出结果再和自己的expectation比较,起到verify你工作的效果。
数据分析师很重要的一个品质我愿称之为skepticism (怀疑精神)。
很多时候当你看到一个奇怪的结果时(比如近三个月销售额一直在下降),与其立马投入业务分析,不如先去看看这个结果的生成用了哪些数据,进行了哪些数据转化,可视化的操作对不对等等。
如果是数据源头的问题(例如数据捕捉不完整),那就需要先把data pipeline的处理修正,再进行分析。
有时候你甚至会发现业务部门让你做的分析还没开始就结束了…
拿到数据后别急着画图,现实生活中已有的数据很可能不是你直接能用来可视化的数据,你需要进行一定的数据清理和数据转化。
比如算消费者随月份的平均订单花费变化趋势,你一方面要保证纳入计算的数据中销售量>0,另一方面可以观察一下消费者平均订单花费的分布,必要时去掉一些极端值,或者用quantile来表现趋势而不是单一的平均值(易受极值影响)。
一个好的可视化报表(dashboard)还有很多细节需要注意,数据可视化作为“用数据说话”的重要工具,下一节我们会讲更多的设计细节。
发表评论 取消回复