作者介绍 @西索 知乎:Qarcher 资深数据分析专家。 故事很多,余生慢慢分享。 经常被问到的一个问题,数据分析是什么,本质上说人人都是数据分析,只不过很多都是隐形的。它不用刻意的去学,原本我们都会,就是需要不断的复盘、总结,然后归纳成具有条理性的框架,最后需要的是找到一个可落地的解决方案来执行就可以了。 前阵子和朋友聊这个话题,有两点可以值得说,一个是具不具备数据分析的思维,另外一个是具不具备数据分析的技能,两者结合起来才能构成相对有价值的数据分析师。值得品味的是,市面上80~90%的数据分析师都是一个小蜜蜂,做的几乎都是给其他业部门取数的活。 01 了解数据分析之前先锤炼自己的思维 发散思维,即能否对于一个问题、现象、趋势引起自己的思考并且将思考的内容以数据化的形式呈现出来;辩证思维,在通过数据论证之后能否得出一定的结论并且告诉其他人;系统思维,能够将零散的知识点、业务块整合起来形成有假设有根据有推论有结果的报告进行输出;…… 有了思维和技能,需要思考的便是动机: 我和我朋友最近都在准备面试,在这个过程里面有谈到一些概念。什么是场景,动机加上数据等于场景,我们需要站在用户的立场去思考问题,他们的行为产生了数据,反过来数据是行为的映射也是行为的结果,可以理解为投影。做数据分析,其本质就是在分析行为,通过归纳和总结去发现规律,最后产生价值。 02 日常管理中的分析场景阐述 一些典型的分析案例,譬如说从用户的哪些信息里面能够判断流失了或者留存表现好,通过哪些维度的数据能够合理的对用户进行分层,用什么方式能够预测未来的发展趋势,怎样能够描述市场上的供需关系,如何才能更好的监控内部的数据质量……这些都是一些公司在日常管理中碰到的问题和痛点,之前和别人聊到一个点,数据是真实业务的投影,也是业务好坏的映射,通过对信息的处理转化成为数据关系再用图表的形式呈现出来,让更多的人方便发现其中的规律,然后去调整策略。这便是数据分析的价值,最典型的过程是对用户群体进行分类划分标签,对不同类的人挖掘他们的共性,根据共性判断应用哪种营销策略,通过数据监测策略的执行好坏,应用自动化的过程呈现当前状态,使用算法对未来的可能性进行预估。 前几天跟一个朋友介绍了当下市面上比较成功的几个算法应用的案例,给举例子说了淘宝、头条、抖音、菜鸟和高德,对应了商品推荐、内容区分、影音识别和线路规划,前期都需要做大量的数据研究,这就包括用户分类、商品标准化、主题建设、词汇收集、图片素材、gis信息等等,所带来的商业场景就是当你登录到任何一个app,就会有大量你喜欢的、猜你想的、别人喜欢你可能喜欢的广告呈现出来,然后根据平台的用户基数,但凡1万个人里面只有1个人成交,在几百万几千万的用户基数下,带来的成交量也是很可观的。所以流量会成为很多互联网公司的第一推广目标,从哪些渠道引流、如何选择市场拓展、怎样引导转化以及用户留存。 这些之后遗留下来的问题都是业务关注的重点,回归到本质就是当碰到问题的时候管理层应该如何做决策,纯粹的经验、市场敏感度都可以做决策驱动,通过多位数据分析可以做到的是决策验证,往往会有意想不到的发现。 03 人生苦短我用python python是目前数据分析应用相对比较多的一个工具。很早之前看过一句话,所有工具的产生都是为了解决特定的问题。不可否定的是python很强大,但是也不能说它就能替代所有的应用场景,有时候一个简单的问题通过Excel就能解决掉,或者手写也能解决掉。值得一提的是,如果python处理数据、系统交互、算法模型都很熟悉了,那它能解决的一个点就是效率,极大的缩减重复性的工作内容,然后可以有更多的时间用来进行思考。 同理而言,R/SPSS/SAS/MATLAB……所有的统计软件只要你用的熟悉,都能达到相同的效果。 回顾一下自己的学习历程,某种程度上来说是实用主义者,碰到了、有需求的时候才会去主动学,用不到的会先搁着到那边。譬如说最早学R、python,一开始的时候只是拿来和excel做交互,读取表数据、汇总、拆分,然后提取文本、数字,生成一张报表什么的。场景是捣腾出来的,工作里面有无数多的情况下可以用它去代替的时候,就慢慢变成了一种习惯,熟悉度也会增加,没有刻意的去练习过。在处理完一些日常的办公需求之后,拓宽了一些认知和领域,譬如说爬虫、短文本处理、长文本挖掘、数据可视化、交互式图表、自动邮件、监控预警等等。再到后面就是搜罗到的海量数据,想要发现规律和特征,就衍生出算法方面的知识点,怎么聚类、分类,如何去做预测,怎样才能提高准确率,怎样做模型评估。学习都是层层递进的一个过程,维持着对它的兴趣,便会一直驱动着前进。 04 关于价值的理解 工作时间久了,往往回过头去看自己之前做的事情,多数情况下是在无数繁琐的事情里面扎进去,然后又不可自拔的跳到下一个循环,简直活成了一个工作机器。譬如前面说的,日复一日的取数,十年如一日,就是不去思考采集到的数据可以产生怎样的商业价值。 其实很多事情一开始并没有价值,都是无脑的在堆工作量。想表达的是量变产生质变,如果没有发生,只能说明一个问题就是思考的代入感不够,这样导致的结果是造成越来越麻木。清醒的人是少的,但凡看到自己身上的不足都会奋不顾身的去补充,但是又会被惯性拉回来,所以这时候就需要不断的做自我反思。 思考是一种习惯,并不是心血来潮的那么几天就能养成的,造成的一个问题就是容易想太多。时间久了,对于自己的未来会看的特别的清楚,然后就丧失了不少兴趣和激情。 文章知乎链接: https://zhuanlan.zhihu.com/p/95306855
发表评论 取消回复