作者介绍

@爱丽丝

一个想转数据分析的测试,

希望大佬们多多指教。

0

前言


近期,通过看书的方式在从0开始学习数据分析,以下是通过读书所了解到的一些数据分析基础知识。


1

什么是数据分析?


字面上的理解就是对数据进行分析。至于较为专业的说法,是使用适当的统计分析方法对收集来的数据进行分析,将它们加以汇总和理解,以求最大化开发数据的功能,发挥数据的作用。总而言之是对某一研究对象使用相应的统计分析方法,对收集来的数据进行整合、汇总,找出所研究对象的内在规律,挖掘其中的价值,也就是用数据来发现某些现象形成的原因数据所呈现的结果。


2

为什么要数据分析?


前面也提到了我们可以通过数据分析得到数据背后的信息,即所研究对象的内在规律。并且数据分析在实际工作中,还能帮助管理者进行判断和决策,以便采取适当策略与行动。例如企业的高管希望通过市场分析和研究,把握当前产品的市场动向,从而制定合理的产品研发和销售计划,就得依赖数据分析。而且数据分析在企业日常经营分析中的三大作用就是:现状分析、原因分析、预测分析。 


3

数据分析有什么步骤呢?



3.1

明确分析目的和分析思路


首先,做事之前得目的明确,才不至于迷失方向,如在开展数据分析之前要想清楚开展数据分析的原因以及通过这次数据分析要解决的问题。然后,在确定好目标后还要梳理好分析思路,搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标等。最后还要确保分析框架的体系化,使分析结果更有说服力。

明确分析目的是比较简单的,例如某公司业务出现了某些问题,想弄清楚其原因并找到相应的解决方法。那么问题来了,怎么明确分析思路?以及什么是分析框架的体系化?书里提到了要以营销(4P、用户使用行为、STP理论、SWTO等)和管理(PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等)理论为指导,搭建分析框架以确保分析维度的完整性,分析结果的有效性及正确性。体系化就是先分析什么,后分析什么,使各个分析点之间具有逻辑联系。下面我们就来学习一下常用的五种分析方法理论。

3.1.1

PEST理论


那么PEST理论到底是什么适用于什么类型的分析?又应该从哪些方面及哪些指标去分析呢?我在读书的过程中做的笔记是图3.1.1这样的。其中书上列举了以PEST理论来进行互联网的行业分析,如图3.1.1.1
图3.1.1

图3.1.1.1


3.1.2

5W2H分析法


那么5W2H具体指什么?适用于什么场景?且看图3.1.2.与图3.1.2.1
图3.1.2

     图3.1.2.1


3.1.3

逻辑树分析法


逻辑树又称问题树、演译树或分解树等。具体内容请看图3.1.3,具体应用如图3.1.3.1的利润增长缓慢分析。
图3.1.3
图3.1.3.1


3.1.4

4P 营销理论


4P营销理论里面,4P具体指的是什么?工作过程中在什么场景用到呢?请看图3.1.4、图3.1.4.1

图3.1.4

图3.1.4.1


3.1.5

用户行为理论


用户行为理论是指用户为获取、使用物品或服务所采取的各种行动。即用户对产品从认知、熟悉、试用、使用、再成为忠诚用户过程中的各种行为的研究。我们要做的就是以客户使用行为理论,梳理出具体业务中的各个指标之间的逻辑关系,构建符合公司实际业务的分析指标体系如下图--网站分析图



3.2

数据收集


按照确定的数据分析框架收集相关数据。根据收集方式的不同分为线上、线下收集,根据收集渠道又分为内部、外部收集,总而言之就是收集数据分析所需要的数据。
在收集数据之前首先得了解数据的构成即字段和记录;常用的数据类型;数据的来源;以及数据表的设计要求;以及后面导入数据,如图3.2
图3.2

3.3

数据处理


数据处理是对收集到的数据进行加工整理,形成适合数据分析的样式。其基本目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。

数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。也就是得过滤掉收集到数据中的无效数据及将数据加工成可分析的数据。

3.3.1

数据清洗


数据清洗是删除重复的数据,填充缺失的数据,检测逻辑错误的数据。具体详情如图3.3.1

图3.3.1

3.3.2

数据加工


数据加工就是对现有字段进行抽取、计算或转换,形成分析所需要的一系列新的数据字段。
具体操作如图3.3.2

3.3.2图
  

3.4

数据分析


数据分析是使用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。在确定分析思路阶段,应当要为分析的内容确定适当的数据分析方法。由于数据分析多是通过软件来完成的,所以必须在掌握各种分析方法的同时也要熟悉主流数据分析软件的操作。下面就是常用的数据分析方法。

3.4.1

对比分析法


对比分析法如图3.4.1

图3.4.1


3.4.2

分组分析法


分组分析法详情,请看图3.4.2

图3.4.2


3.4.3

结构分析法


结构分析法是指总体内各部分与总体相对比的分析方法,即总体中各部分占总体的比例。占比越大则对总体的影响越大,企业运营分析中常见的指标如市场占有率。

结构分析的计算公式为:结构相对指标(比例)=(总体中某部分值/总体值)*100%,市场占有率的公式为:市场占有率=(某商品的销售量/该商品的市场销售总量)*100%。

3.4.4

平均分析法


平均分析法是运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。其详情如图3.4.3

图3.4.3


3.4.5

交叉分析法


交叉分析法通常用来分析两个变量(字段)之间的关系,即同时将两个有一定关系的变量及其值交叉排列在一张表格内,使各变量值成为不同变量的交叉结点,形成交叉表。

3.4.6

综合评价分析法


综合评价分析法是通过对实践的总结,逐步形成的一系列运用多个指标对多个参评单位进行评价的方法,也称为多变量综合评价分析方法。详情如图3.4.4

图3.4.4


3.4.7

杜邦分析法


杜邦分析法是利用各主要财务指标之间的内在联系,对企业财务状况及经济效益进行综合评价的方法。杜邦分析体系的特点是,将若干个用心评价企业经营效率和财务状况的按其内在的联系有机的结合起来,形成一个完整的指标体系,并最终通过权益收益率来综合反映。该体系以净资产收益率为龙头,以总资产收益率和权益乘数为核心,重点揭示企业盈利能力及权益乘数对净资产收益率的影响,以及各相关指标间的相互影响关系,为各级管理者优化经营理财状况,提高公司经营效益提供了思路。如提高总资产收益率的根本在于扩大销售、降低成本、优化投资配置、加速资金周转、优化资金结构、确定风险意识等。还可以用杜邦分析法分析其他类似问题,如下图的某公司的某行业的市场占有率分析。

市场占有率杜邦分析法示例


3.4.8

漏斗图分析法


漏斗图是一个适合业务流程比较规范、周期比较长、各流程环节涉及复杂业务过程比较多的管理分析工具。其优点在于是对业务流程最直观的的一种表现形式,可以快速地发现业务流程中存在问题的环节。如下面的网站转化率图:
网站转化率图


3.4.9

矩阵关联分析法


矩阵关联分析法在企业营销管理活动中应用广泛,对销售管理起到指导、促进、提高的作用,而且在市场定位、产品定位、用户细分、满意度研究等方面都有较多的作用。矩阵关联分析法是根据事物(如产品或服务等)两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法。以属性为横轴、属性B为纵轴,组成一个坐标体系,在坐标轴上分别按某一标准(平均值、行业水平、经验值等)进行刻度划分,构成四个象限,将要分析的事物对应投射至这四个象限内,进行交叉分类分析,直观地将两属性的关联性表现出来,进而分析每个事物在这两个属性上的表现。矩阵关联分析法在解决问题和资源分配时,为决策者提供重要的参考依据,先解决主要矛盾再解决次要矛盾,有利于提高工作效率,并将资源分配到最能产生绩效的部门。

3.4.9.1

矩阵


如下图矩阵关联分析法的经典案例—用户满意度研究进行矩阵应用的介绍,通过矩阵能够非常直观地看出公司在各方面竞争的优势和劣势分别是什么,从而合理分配公司的有限资源,有针对性地确定公司在管理方面需要提升的重点。
某公司用户满意度优先改进矩阵图


如上图可知:
第一象限为(高度观注区),属于重要性与满意度都高的象限,标志着用户对服务的满意度与其重要性成比例,即用户对公司提供的某项服务的满意程度与客户认为该项服务的重要程度相符合,对位于该象限上的服务项目,公司应该继续保持并给予支持。

第二象限为(优先改进区),属于重要性高而满意度低的象限,标志着改进机会,用户对公司提供的某些服务的满意度大大低于他们认为对应服务的重要程度,公司必须仔细分析该象限中服务项目出现该情况的原因,并就出现的问题进行改进,从而有效提高客户的满意程度,为公司赢得竞争优势。

第三象限为(无关紧要区),属于重要性与满意度都低的象限,对位于这个象限上的服务项目,公司要更进一步的关注用户对其期望值的变化。

第四象限为(维持优势区),属于重要性低但满意度高的象限,这个象限标志着资源的过度投入,公司投入了比用户认可满意的结果更多的资源,在条件允许的情况下,公司应该把投入在该象限中的过多资源转移到优先改进区中去。

3.4.9.2

发展矩阵


在普通矩阵中增加发展趋势维度,让读者非常直观地了解之前每个服务项目在用户评价中处于何种位置,现在处于何种位置,将来又如何发展,为决策者提供强有力的支撑依据。如下图

3.4.9.3

改进易难矩阵


在普通矩阵中增加改进易难程度的指标,可以根据专家访谈法,先获取多位业内专家对于各个指标的改进易难程度的评价,最后综合各专家的评价以确定最终指标的改进易难程度。或也可以用目标优化矩阵与获取权重值道理一样,通过比较改进的难度来获取其难易程度。例如下面以气泡大小为项目改进的难易程度。

在改进难易矩阵中可快速准确地确定改进的先后顺序,为企业进行短板改进提供有效的决策依据。

3.4.10

高级数据分析法与其应用方向



3.5

数据展现


数据展现的目的是在展现数据分析结果时保证大部分人的理解是一致的。一般情况下是用图表呈现分析结果,呈现结果方式优先级由高到低依次为:图、表、文字。

3.6

报告撰写


数据分析报告是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。一份好的数据分析应具有的特性如下:有好的分析框架,图文并茂、层次分明、有明确的结论、有建议或解决方案。有好的分析框架、主次分明可以使阅读者正确理解报告的内容;图文并茂可以增加数据的活泼性,提高视觉的冲击力;至于明确的结论就是数据分析进行的意义;最后建议或解决方案是为决策者决策时作参考,必须得在了解和熟悉业务的前提下提。

PS:上面的内容是本人看《谁说菜鸟不会数据分析》时做的笔记。

点赞(4210) 打赏

评论列表 共有 1 条评论

Mr_Wen123 3年前 回复TA

给我看困了~

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部