疫情期间,大家在家学习的兴趣热度很高,最近很多小伙伴们都会问我数据分析的一些问题。关于数据分析到底如何学?如何快速入门?我想转行做数据分析,需要准备哪些技能?转行做数据分析,学到什么程度可以找工作?有哪些数据分析方面的书可以推荐?数据分析师的薪酬水平怎样?。。。。

这些问题,我希望以后能够在公众号上一一帮助大家解答。今天我给大家开一个数据分析基础系列篇,希望能够给还没有入门的,或者入门之后还处在迷茫期的新手系统地整理一下数据分析的基础知识。

关于如何学习数据分析?对于很多新手马上就会想到我需要掌握什么样数据分析的技能,这个没有什么问题,学习数据分析掌握它所需的必备技能还是非常有必要的。但是有的人一上来可能就会选择学习数据分析工具,比如Python、R,对于没有编程基础的,没几天可能就选择了放弃。工具学不会,然后就抱着机器学习或者统计学等理论知识啃,如果没有一点数学基础的,没几天又放弃了。其实,这些都不是科学的学习数据分析的方法。假如我们想要系统的了解它,然后循序渐进的来学习它。

那学习数据分析应该掌握哪些必备技能?下面,我们可以从BOSS直聘上,看看各公司招聘数据分析师的Job Model,就可以大概知道数据分析师所应具备的能力。

图片

图片

通过以上的Job Model所对数据分析师的技能需求,总体上差别不大,可以归纳总结如下几点:

  • 数据分析工具,必须要掌握1-2种。通常来说,会要求你会Excel/Python/R/SPSS/SAS等,有编程基础的推荐大家掌握Python和R,没有编程基础的可以考虑熟练掌握Excel和SPSS,现在使用比较多的还是Excel和Python。

  • 数据库,绝大部分会要求写SQL,高级的分析师或者大数据分析师,还会要求能够处理大数据,需要Hive。要求写SQL的分析师,通常会接触到偏底层一点的数据源。如果你是业务人员,SQL不一定是必须掌握的。

  • 统计学知识,需要掌握,数据分析工作,不管是对于那些没有统计学背景的还是有统计学背景的,统计学这门知识,必须要掌握,需掌握均值、方差、标准差、概率、假设检验、置信区间等基本概念。

  • 数据挖掘知识,这个对于一些高级的数据分析项目,会要求建模的工作,会需要用到建模的知识,需要做预测。但并不是每个学数据分析的,都一定要掌握。当然掌握了,你的分析方法更多,思路会更开阔,在职场上也是一个加分项。

  • 结果输出,数据结果的呈现,与业务部门的沟通,都需要对数据分析的结果进行输出,这里用的最多的工具Excel、PPT或者更高级的一些可视化工具,比如Tableau等。

  • 业务/思维,做数据分析不光是要掌握那些工具类的知识,这些是远远不够的,比工具更重要的是你对你所属领域的业务理解程度,以及对商业数据的敏感度,以及你的数据分析的项目经验等。

看上去总结的蛮简单的,但其实每个技能都能拆分出一个很庞大的知识体系。我们再从整个数据分析的流程系统地看看数据分析所应具备的技能和知识点,以及所必须注意的点。数据分析的流程共包含6个环节:业务理解、数据理解、数据准备、建立模型、模型评估和结果应用:

  • 业务理解。理解业务背景,评估业务需求。数据分析的本质是服务于业务需求,如果没有业务理解、缺乏业务指导、会导致分析无法落地。

  • 数据理解。需要掌握我们能够获取的数据源,并且正确的评估和保障原始数据源的质量。

  • 数据准备。运营统计方法对数据进行探索,掌握数据内部的规律,并对数据进行转换,以备所需。

  • 建立模型。综合考虑业务需求,选择正确的方法、工具、建立最合适的模型。

  • 模型评估。对模型的精度、准确性以及效率和通用性进行评估。

  • 结果应用。将模型应用于业务实践中,对模型应用效果及时跟踪和反馈,以便改进模型。

图片

接下来,我会围绕数据分析流程,推出6篇数据分析基础系列文章:

数据分析零基础系列(1):业务理解篇

数据分析零基础系列(2):数据理解篇

数据分析零基础系列(3):数据准备篇

数据分析零基础系列(4):建立模型篇

数据分析零基础系列(5):模型评估篇

数据分析零基础系列(6):结果应用篇

今天这一篇,重点给大家讲讲“业务理解”这个环节。

很多刚学习数据分析的小伙伴们,容易走入一个误区,就是过分的只关注数据,或者方法和工具,却容易忽略了数据背后的业务需求。埋头苦干一通,最后业务人员一句话否定掉:“你的分析结果不符合业务逻辑”。

所以说,要想做好数据分析,就得花时间培养自己的业务思维,理解数据背后的业务背景,正确的评估业务的分析需求,才能做出既符合业务逻辑,又有价值的数据分析结果。什么是业务思维?要懂业务思维,需要明白两个关键点,一是要把业务需求作为数据分析的起点,二是始终要关注业务环境和逻辑。

举个简单的例子,对于做零售业的朋友都知道三个字,那就是:人、货、场。比如说某个区域的客单价下降了,对于很多数据分析师来说,可能马上就会去拿着数据做多维交叉分析,分析什么原因导致客单价下降了,而不是主动去思考里面的业务逻辑。客单价可能跟商品有关,也可能跟人有关,也可能跟场有关,所以更应该是从人、货、场三个方面去思索客单价下降的原因是什么,才能找到背后的原因。而不是遇到一个数据出现问题,就直接去从数据中找答案,答案实际上就藏在背后的业务逻辑里面。

如果你拥有业务思维,你就应该关注业务需求关注的点是什么?也就是说业务想要通过数据实现什么需求,再去对着数据来源、口径、清洗、分析做一系列工作。

业务需求分析的流程是什么?我以阿里巴巴的业务需求分析的流程为例,通常流程是这样的:

  • 业务需求的收集。数据分析的起点是业务需求的收集,业务需求来源通常是来自业务方或者是业务线对口的分析师。

  • 评估业务需求的优先级。业务需求优先级评估主要是从建模技术实现的难度评估、产出物对业务支持的价值评估、产出物对分析团队的影响力提升评估等3个方面考虑。

  • 项目组的成立及前期摸底。明确课题组的人员构成及前期任务。

  • 向业务方提交正式的项目计划书。

图片

1、业务需求的收集

俗话说的好,好的开头是成功的一半,一个好的数据分析项目,一定是在最开始的业务需求提炼中就能够有效聚焦业务需求,并且把业务需求适合转化成数据分析课题。

所谓有效聚焦业务需求,就是说提炼、收集的业务需求应该是定义清楚的、符合业务场景的、并且能够反映当前业务的难点、瓶颈和前景,如果能够有效解决,将会对业务发展产生正面的推动和促进作用的。

所谓适合转化成数据分析课题,是指在商业实践中,有的分析需求是伪命题,比如明显不符合逻辑的业务假设,而有的分析需求则不具备分析条件,比如数据积累不足或者说脏数据太多等。

在业务需求的收集阶段,需要注意以下几个点:

  • 明确该环节的责任人。通常来说,对于对于大公司,每个业务线或者业务板块,都应该有相应的数据分析师作为接口人来对接业务需求,该数据分析师需要熟悉相关的业务内容,负责对日常数据分析工作的支持。同时,该数据分析师也需要定期收集或者提出业务线的专题数据分析挖掘课题方向。所以,各业务线或业务板块的接口数据分析师就是该环节的责任人,他要对业务中潜在的数据分析挖掘需求的收集、提炼和整理工作负责。

  • 明确数据分析需求的来源。需求的来源通常有两个,一个是业务方或者管理层提出的分析需求,另外一个是由数据分析师基于自己的观察和判断提出的分析需求。业务方提出的需求,后期的分析讨论和落地应用实践中也常常容易得到大力支持和配合,应用落地相对简单。数据分析师提出的潜在需求,相对业务方提出的分析需求常常更容易转化成数据分析课题,更有复合性,既兼顾业务,也兼顾了分析技术。

  • 要求业务方提交正式的需求申请书。分析需求的提出,不管是业务方提出的,还是数据分析师自己提出的,都需要业务方正式的提交一份需求申请书,通过邮件的方式提交给数据分析部门,同时抄送给各方的业务主管。只有经够业务主观同意的业务分析需求,才可以保证随后的业务分析展开和落地应用环节能得到业务方的有效支持和参与。

2、评估业务需求的优先级

分析需求评估是业务分析中的核心环节,很大程度上决定了分析课题的最终商业成果和商业价值。通常是,由数据分析部门牵头成立一个需求评估小组,以负责需求评估的具体实施。需求评估小组负责对数据分析部门所接受的所有业务分析需求进行评估并做决定,同时监督立项的各分析课题的有效展开(或分析过程监控),在面对分析困境时要能给出明确具体的解决方法。

在业务需求评估阶段,需要注意以下几个点:

  • 具体评估的方向,注意是从建模或者分析技术的实现难度进行把控、不同分析思路以及方法的罗列、潜在课题产出物对业务应用部门的商业支持价值、潜在课题产出物对数据分析部门的影响力提升等,以此来评估业务需求的合理性和优先顺序,并初步过滤一些不合理的需求,诸如伪命题、数据积累不足等。而对于合理的需求分析,除了排出优先级顺序之外,还要按照投入产出比、资源等情况而定。

  • 在需求评估会上,提交需求的业务方或者接口分析师要负责准备比较详细的背景介绍材料,以回答评估小组的提问。如果有必要,分析师可以考虑在开会之前和业务方详细沟通并达成共识。开会的过程中,记录并在会后回复重要的但在会上无法回答的关键数据、关键背景、关键业务逻辑。

3、项目组的成立及前期摸底

此步骤重点在于成立具体的分析课题组,明确课题组的人员构成及前期任务,具体的注意点包含如下:

  • 具体课题组人员的构成。课题组的组长通常是经验丰富的数据分析师担任,每个课题组至少包含一名来自业务方的业务代表。这是因为一方面可以保证数据分析挖掘过程自始至终有业务方参与,并且能够得到业务方的理解和支持。另外一方面也可以在分析挖掘过程中,随时听取业务方的意见和建议,随时得到业务方的有效支持和响应。

  • 前期摸底,主要是与业务方沟通、讨论的过程中,抽取粗略的背景数据,以便透彻理解业务背景和需求逻辑,为准备定制课题计划书提供重要的理论和数据参考依据。

4、向业务方提交正式项目计划书

最终,我们需要给业务方提交一份正式的课题(项目)计划书,具体需要注意的地方包含以下几点:

  • 经过前期的摸底,将需求提交给评估小组,获得认可后,就要通过邮件给业务需求方提交正式的项目加户数。计划书包括具体课题组的人员组成、时间节点、人员分工、产出物预估等。

  • 对于比较复杂的课题,有一定技术难度的课题,其项目计划书通常是需要事先提交给评估小组的负责专家进行认可的,之后才能正式提交给业务方。之所以增加这个环节,主要是确保产出的风险,降低不确定性。

还是那句话,没有业务指导的数据分析只能是一张废纸,这一点对于刚刚入门数据分析的新手来说,尤其要注重积累和培养。


点赞(6) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部