作者介绍

@子曰

毕业于北京大学信管系;

10年数据分析与数据治理经验;

先后服务于互联网大厂、央企总部和领先的ToB IT公司,数据团队负责人;

“数据人创作者联盟”成员。


01 数据治理的重要地位


俗话说“巧妇难为无米之炊”,但对于数据人员,更可怕地恐怕是“巧妇难为糟米之炊”。


在企业数字化场景中:米,就是业务数据;巧妇,就是数据团队;食客,就是数据使用者,如决策层、管理层和各业务人员。


无米的话,食客饿肚子的原因明确,怪不得巧妇,产米就对了(通过信息化建设沉淀数据资产);倘若米糟(数据质量差)可麻烦了,请问巧妇们,这饭做还是不做?


在数字化时代,几乎所有企业的所有业务,都需要基于数据进行决策。信息化基建准备好了箸玉杯象(业务系统、数据平台和报表工具),组织也高薪聘请了诸多巧妇(数据科学家、数据工程师等)。食客要点餐,那么问题来了,米可食乎?


通过数据治理,改善数据质量,成为了重中之重的前置工作。

 

02 数据治理的困境


数据治理在近几年持续火热,但普遍来看面临如下三个困境:


1) 投入大

对于部分行业企业,如金融、电信、电网,基于监管刚需或行业标准,数据治理有较好的环境和土壤,做起来相对顺利。但其他行业或大部分中小企业中,为数据治理专项投入(专人、专项、专门的工具平台)还是非常困难的。


2) 价值不凸显

传统的数据治理有些为了治理而治理,项目目标就是建章立制、构建标准、清洗数据,或泛泛提出“提升数据价值,深化数据应用”。这样治理完之后,很难说清楚治理投入和“降本、增收、增效、助决策”的关系,或者很难量化价值。


3) 容易虎头蛇尾

传统数据治理通常讲究“自上而下”:做规划、搭组织、建诸多标准流程制度;但落到执行层面动作容易变形——录数人员该干嘛干嘛、应用开发人员我行我素,效果不尽人意。

 

那么,有没有轻量化的数据治理方案?适合没有太多资源投入、业务变化快、要求短期见效,或目前数据管理成熟度不高的组织?


可能“精益数据治理”是个思路。下面结合业内讨论和自身实践,做一些总结思考和抛砖。

 

03 什么是精益数据治理


1)精益思想

可参考《精益管理介绍》https://wiki.mbalib.com/wiki/%E7%B2%BE%E7%9B%8A%E7%AE%A1%E7%90%86。精益思想的特点,总结来看三个方面,一是明确价值,二是减少浪费,三是持续改进。


2)精益数据治理

是利用精益思想和数据治理方法论,聚焦特定场景,以敏捷的方式、最小的代价、为业务创造价值的数据治理方法。精益数据治理的特点:投入小,周期短,价值明确,持续产出。

 

04 精益数据治理实践方法论


结合精益思想和DAMA理论,对于精益数据治理实践,笔者总结了一个公式:


1)价值场景

精益数据治理一定要有明确的价值场景。例如,将数据治理任务嵌入到业务最关心的战略管理点、业务整改专项,最好和业务数据分析类的大项目绑定。划重点:嵌入。


2)识别发力点

精益数据治理的内容,依然是从DAMA的几个维度出发,根据场景中的痛点,剪裁、聚焦,找出数据方面的主要矛盾。

   

3)各个击破

以“简洁、敏捷、实用”为原则,以“对业务和技术的负担最小”为目标设计数据治理策略,包括流程策略、规范策略、技术策略。


4)持续完善

业务项目结束后,及时宣贯数据治理的“业务价值”,让业务“因为看见,所以相信”,“接受方法,摒弃抵触”,形成长效机制。数据治理团队还需及时总结复盘,方法论复制到其他业务领域。


05 精益数据治理实践案例


下面以某2B类中型企业的《客户数据治理》为例,详细介绍下实践方法。


背景:客户是企业生存发展的基础。为贯彻“以客户为中心”的战略,企业成立了客户委员会,持续对客户、客群、贡献率进行跟踪分析,以期实现对客户全生命周期的分析管理和运营。但由于客户数据“不全不准”,客户主数据标准不统一,制约了上述目标的有效达成。

 

1) 价值场景

公司设立《客户分析专项》,目标为构建价值模型、开展跟踪分析、定制营销策略、持续客户运营。项目主责人为业务人员。数据团队参与。根据讨论共识,《客户数据治理》将作为项目方案中的“一部分”,是“重要的基础工作”。


数据治理子项目的目标非常明确:通过一系列数据治理工作,确保客户数据清洁完整准确,支持客户分析决策和客户运营。领导层对此认可且高度重视。(此认可和共识一定要在项目启动阶段做透,切记)


2) 识别发力点

识别发力点,可以充分利用数据需求和指标体系成果。三个STEP。


STEP1:整理数据需求

首先通过和业务分析人员沟通,明确了《客户价值分析》所要用到的指标体系和数据范围:客户数据范围是XX事业群对应的客户,仅为企业客户;时间范围需近X年的;若要支持分析和预测,头部50家客户准确度100%,非头部客户准确度90%以上。

 

图:客户价值指标(示例)


接着,根据指标计算公式,合并同类项,找到了指标对应的数据字段,填写到如下图中的“包含的计算字段”中。这些字段覆盖了业务分析中的指标值和所有维度。

 

图:指标对应字段(示例)


STEP2:探查数据质量

对上图中整理出来每一个“计算字段”,进行了数据质量探查。模板示例如下。数据质量探查可参考文章《数据质量管理:6个维度,50个检查项》

图:数据质量探查清单


STEP3:圈定治理对象

根据STEP2的结果,把存在数据质量问题的字段拎了出来,作为明确的“数据治理对象”,并与业务共识现状,标记了治理优先级。注意,此处细化到具体的数据字段,业务最有感知度,也容易聚焦。

 

3)各个击破

对数据质量探查的结果进行总结,结合DAMA数据治理策略,分而治之,各个击破。


通过诊断,客户数据的痛点在于三个方面:主数据和参考数据缺乏标准、历史数据质量较差、没有维护规则。根据痛点,明确了治理策略开展具体落地动作。

 


此处结合DAMA理论,有几个实操注意事项:

A. 数据owner的设立。谁出标准,谁更应该做owner。这在讨论中顺水推舟形成,不一定自上而下指定。


B. 制度流程。尽量表述清爽简洁,缩短篇幅,“说人话”,尽可能提炼出“一页纸”要点。


C. 数据清洗和运维。可遵循一个原则+三个能够。

  • 原则:尽可能从数据源头治理,别打ETL的主意。

  • 能机器录入的就不用人工录入。比如,客户名称、资质等,能通过企查查等接口查询的,就不用手工录入;各类时间戳,最好用某动作对应的系统时间戳;

  • 能自动分类的就不用人工分类。例如客户分类,有严格的MECE标准。

  • 能自动监测就不用人工刷数。在录入端设计各种校验、提示。如客户年营业有个合理区间,超出无法提交;客户类型下拉选择时候给出弹窗提示,方便销售了解参考。

 

4)持续完善

当客户分析专项项目结束的时候,客户数据治理也有了阶段里程碑成果:通过一系列数据治理工作,确保了客户数据清洁完整准确,有效支持了客户分析决策和客户运营。此时,数据治理小组做了四个动作:


A.  参与数据分析。参与或跟进了业务的客户数据分析,支持完成了数据价值落地的最后一公里。


B.  及时复盘总结。特别是总结从业务和视角,总结了客户数据治理带来的业务价值,如降本、增效、降风险、助决策等。


C.  强调长效保障机制。在有成果的基础上声明了持续推进的方法,摩擦力和阻力会小很多。


D.  持续发现数据问题,持续解决,优化迭代,复制到其他业务领域。

 

06 小结


“巧妇难为糟米之炊”,对于食材的制备,食客们却往往耐心有限而认知不足。精益数据治理让数据治理不再厚重,更具有实操性。再重申下实践要点:

1)一定要对齐业务价值。无价值,不治理;能少做,不多做。

2)减少不必要的动作。在治理落地中,要为业务人员、开发人员、治理人员都减负。

3)短平快。战略上有统一的目标、框架和节奏,但战术上各个击破,打歼灭战,尽可能快速出结果。


参考文献:

1、精益数据治理的助力传统企业数字化转型!

2、凯哥讲数据中台:精益数据治理时代的来临

3、数据时代,企业如何以价值为导向实现数据高效利用 

4、数据质量管理:6个维度,50个检查项!

5、面向建设工程规划报批的精益数据治理研究与实践 《机电工程技术》,2021

点赞(824) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部