作者介绍 @李凯东 某大厂大数据总监,管理经验丰富; 负责数据、用户、搜索、推荐、AI等; 曾有10年连续创业经历; 产研运全能,国内知名比赛获奖无数。 “数据人创作者联盟”成员。 在数据分析和数据产品领域的书总体上还是很少,所以每一本这个领域的书都是对于这个领域的贡献。今天我们来读一个刚初版不太久的书。 推荐指数:六颗星。⭐⭐⭐⭐⭐⭐ 零、整体评价 从行业目前的图书情况来说,这本书还是一本可以读的书。从头到尾的结构性还不错,数仓内容介绍的比较全面,同时服务部分虽然有的不够充实,但是已经是很少的实战案例了。 对于相对数据领域有一个比较完整了解的人可以买来一看。当然读的时候需要有一定的耐心这个在最后会说明。 01书的章节点评 · 第1章《那些困扰我们的数据问题》 作为开篇第一章,很好的开启了话题,也引入了一些问题。 ·《数据中台篇》 这个部分对离线数仓的介绍是比较成体系的。对于数仓结构不熟悉的同学来说是非常好的资料。但是美中不足就是由于数仓的概念性太强,而且对于不熟悉的人来说,概念过于陌生,而本书中并没有一个很完整地例子来进行解释,所以对于没有经验的人来说读起来会比较晦涩。 ·《数据分析篇》 ① 数据分析理论 这个部分对于大家了解数据分析师有很好的指导作用,对于初中级的数据分析师在工作方式、工作内容和工作方法都有很好的指导。 ② 数据分析实操 很好的理论结合案例的部分。从预测型、描述型、诊断型三种类型的问题和报告进行讲解。不过里面有一个小点就是现在互联网的数据分析师一般来讲是不做PEST分析的。PEST分析一般由产品经理完成。 ·《数据应用篇》 ① BI系统 这一章的内容整体是构建在大厂数仓到BI这样的架构之上,所以还是有些局限,整体的内容对于BI的介绍不够系统和全面。只是大概知道了数据是通过数仓进入到BI系统,然后经过一定的加工然后通过可视化的配置进行报表展示。 然而对于BI的整体技术架构,以及创建报表的流程分步介绍都不够好。同时对于技术的特性不够了解,所以会对hive,spark,clickhouse等的特性理解有一定的误区。 内部过于大的篇幅介绍了配置一个报表的配置项,然而并没有案例作为配合,所以整体理解起来比较困难。关于什么类型的图表适合进行什么样的数据分析,这里强烈推荐一个网站:图之典,大家在这里可以系统的进行学习。 ② 用户画像 这里面对于用户画像和用户标签的定义和互联网常识性的定义还是有一些区别的。个人更推荐大家使用互联网常识性的定义来看比较好。这里推荐看《数据产品经理:实战进阶》这本书中关于用户画像的定义。 这一部分定位不是很清晰,不够整体上理解为用户画像如何引用可能更好。同时书里关于标签的划分有一定的指导意义。如果想对用户画像本身有一个系统性的了解,那么不太建议读本章的内容。 ③ 电商反作弊体系 这一章的内容相当实战,对于电商一些典型的场景进行了介绍。是很好的科普及不可多得的案例内容。 ④ 资讯个性化推荐 这一章的内容对于资讯推荐有一个比较完整的介绍。但是整体的结构性不够好,所以在资讯分类、标签和用户画像之间的匹配的理解上有一定的障碍。同时应该降低算法的篇幅。而同时排序部分的描述过于简略,并没有很好的解释清楚排序的真正意义。 ⑤ 电商个性化推送 这是市面上比较少的相对系统的介绍个性化Push的内容。如果可以讲的更细致一些可能会更好一些。 02 读书的推荐顺序 这本书的结构性还是不错的,所以如果想整体对互联网大数据工作有所了解,那么就从头到尾的读比较好。如果是有经验的读者,那么可以针对性的了解也不错。 03 还想说点 ① 割裂感和晦涩感 本书的组织者已经很努力通过一个公司讨论的形式对整体内容进行了整合,但是由于每个人的写作风格的确不一样,还是有一些割裂感。本书的结构其实已经很努力按照从数仓到应用这样的结构进行编写,但是由于数据领域的概念很多,而且对于没有经验的人极其晦涩难懂,这本书又没有很好地例子来支撑,就导致了读起来晦涩感比较强。 ② 关键节点失败,影响后续节点 在产品应用里面介绍了用户画像,但是这个部分是这本书里面我认为最失败的部分。首先并没有完成行业通识性的用户画像的介绍,同时由于例子的缺失导致整体比较难理解,而后面的推荐和个性化推送都这一章有依赖,就会导致后面的内容理解难度的提升。 ③ 数据中台的美中不足 在整个架构中,除了上面对于内容的评价还缺少实时数仓部分的内容,如果能把这部分加上就会更加完整。 好了,这本书就解读到这里。 希望我能给大家继续做分享者,不断的帮大家筛选信息,留下最值得内容。 当然也希望我最爱的、正在看这些文字的你,双击屏幕,留下你们的支持:)
发表评论 取消回复