数据空间
您当前的位置: 首页 /数据知识

经验分享 :数据治理中的有趣发现

发布时间:[2019-10-17] 来源:网络 点击量:

中国企业数据治理联盟(www.chinaedg.com/)

数据治理,一般来说,涉及数据获取的治理、数据流程治理、数仓模型治理、数据权限治理、指标体系治理、数据应用能力提升、分析框架治理、数据可视化方案治理等范畴。有着内容涵盖广,琐碎的细节多,外在体感弱,成效周期长,人员心力要求高的特点。

随着近期工作中对数据治理的深入,尤其是在指标治理范畴下,过去的许多认知,在深层次上被刷新了;同时,随着执行中各种细节的碰撞,也有了不少新的发现和观点。酝酿多时,打算甄选若干,希望对大家有所帮助。
 
(当然,本人目前的观点,仅来自本地生活场景下的实践,难免有些片面,读者们请批判地吸收。)
观点一:“数据治理,从最初的最初,就要有所设计。”
 
这话看起来较费解,何谓最初的最初?
如果你是一个创业者,那么你在团队成立的第一天,你就得规划,做些什么样的事,能让你不仅拥有数据,还能正确高效地使用数据。以我对身边朋友的观察,大部分人,会想到要拥有数据,但以为初期有这就够了。
如果你是一个经理人或者决策层,你需要在一个新业务的起步阶段,即在业务规划中,就准备好以“精准量化分析”为目的的一整套的数据治理方案,而不要仅仅罗列几个指标,作为KPI,以体现所谓的“数据驱动”。
如果你是一个项目经理、产品经理或者业务运营,你需要在kickoff阶段,就有方案,以保证健全的数据获取通道,准确稳定的指标口径,多方一致的评价及分析方式。而不是认准领导的绩效,硬拼凑一个本质上也许毫无关联的评价指标。
以我目前的观察,在业务启动初期,数据治理方案的缺失,会使得数据混乱的发展速度,远高于业务发展速度。回过神来你会发现,你以为能靠数据结果给予决策支持,但实际上,你会有一堆的混乱结论。你想有座灯塔,可实际上是一片迷雾。
观点二:如果你是一个leader,当你不能准确了解你所使用的指标口径,就不要推动所谓的“用数据说话”。
 
乍一看,这个观点或许有些极端,但自测一下这个问题,或许你会猛醒:
“你工作中经常查看的报表和数据,你能说清楚他们明确的计算口径么?所属的业务主题、计算的方式、统计周期、限制条件、维度组合、字段定义等?”
如果这个问题你答不全,那么你并不具备指标治理的意识(指标治理是数据治理中,与管理决策最为相关的部分),换个角度说,就是你还没有准备好使用数据。
可怕的是,若leader不能清晰地回答,那么下属、分析师、产品经理等角色,基本上对口径也是一笔糊涂账。这样的结果就是:
管理决策从相对可靠的经验判断,变成依据不准确的数据进行推测;虽然不能说这样的改变有多负面,但有些本优秀的决策者,往往被模棱两可的数据解读挤出自己擅长的领域,以更多的疑虑面对决策,会表现得更“依赖”数据结果,前瞻性决策的能力会变得平庸。
模糊的数据口径,给了“用数据说谎”、“用指标逃避责任”的空间,大大增加了组织的管理成本。相对的,模糊的口径,也确实能带来一些“柔性”协作的效果,毕竟,任何组织里都有“和稀泥”的价值。
各协同部门之间,一旦涉及指标的应用,就一定少不了“对数据”,至少开4次“会”:
第一次,暴露问题,拉群,越拉人越多,伴随各种推脱后,终于,最痛的那一方,万般无奈地作为owner;第二次,搞清楚“owner方”的数据口径;第三次,搞清楚“对方”的数据口径;第四次,确定到底谁的是对的,商量怎么办。往往还有第五次,即由boss们来决定,怎么办。
这里的协同成本,十分可怕。
----分割线---
在上面文中,我抛出了以下两个观点:
数据治理,从业务的最初阶段,就要开始设计。
如果你不了解所使用的各种数据结果的口径,就不要推动所谓的“用数据说话”。
第二个观点换个角度说,就是数据的消费方,一定要有“数据严谨性”的意识,尤其当你是一个leader的时候。第二篇中,我继续抛出一些观点。
 
知识沉淀的健全与否,决定了数据治理的执行成本
数据治理项目,不仅需要深挖各种细节的业务定义,还需要有许多的“决断”(比如确定一版大家都能有共识的口径),需要协同的人,牵扯的部门往往很多。我们先不谈人配合意愿的问题(许多时候,数据治理会触碰协作方的“安全边界”,这是一种寓情于理都可以理解的沟通障碍),我们假设所有协作方都无条件配合的情况下,仍然有极大概率出现的困难,那就是:
“谁都说不清某个关键的细节”
为什么呢?因为知道的人已经走了,或者时间久了忘了,且没有历史记录沉淀下来。在业务变化快,人员流动大的互联网公司,这种情况尤其普遍。
 
如何解决该问题?道理其实很简单,就是加强业务知识管理;但执行基本很扯淡,因为谁都不愿意“打杂”。所以我有两个明确的建议:
每个有明确的组织边界的团队,都要建立《新人上手指南》,由公司HR部门全程监督:内容制作详细且定期更新,每次更新发布,都由两个以上协作团队进行审核;HR跟踪部门新人对《新人上手指南》的评价,该评价计入该部门各层级的KPI考核中。
公司内部,从leader开始,应用任务协作和文档管理工具。目前市面上的协作工具已经很多,私有部署的和saas模式都有,无论大小公司,都能找到适合自己价位的工具。但心理预期要降低,工具的应用,并不能立马解决问题;工具的应用,只是一个起点,能够使整个团队,开始建立知识管理和协作提效的意识。
 
我们可能正在透支整个社会的“数据应用能力”
这个观点在我脑中有段时间了。出现的当时,我自己很诧异,但仔细想了想,也许这真的是事实。为什么我们大力招人,却鲜有合适的人选?尤其是高段位人才。高段位固然是稀缺的,但稀缺的情况能够改善么?目前似乎看不到好的信号。
 
首先,整个大的公共教育环境,对数据分析、数据科学人才的培养是非常滞后的。虽然近年来大力投入资源,但是一是起步晚了,人才补充到市场还需要时间。
二是培养方式不够脚踏实地。高校里,缺乏有实战经验的老师设计课程体系,导致“堆砌”理论,学生的商业感知和动手能力都不够好。市场上的培训机构呢,基本上急功近利,拿入门级的知识当专业课,让学生挂几个“包”,跑几个“函数”,尝试几个kaggle案例,就收一笔学费,不论效果如何。
 
在这两个大背景下,我们大量的“用人单位”,只管招人干活,不管人的培养(许多都是自由生长,尤其是与上一个观点相呼应,当知识沉淀很差时,人才的成长更难达预期)。在门槛越抬越高的情况下,公司内部的小伙伴却没有清晰的成长路径和辅导。那么结果就是,有一定工作年限的所谓的“高阶数据分析人才”,泡沫越来越大。而正在努力的行业新人,却不能在正确的方向上,用合理的时间达到必要的高度。
“既然是泡沫,终究是要破灭的!”
当泡沫破灭,所有人认清了现实以后。国内的数据分析高阶人才市场,有可能出现信心危机。极有可能造成“高阶大数据人才信任感缺失”的情况,市场信心的恢复,可要花点时间。这与金融危机,是一个道理。
“以我个人招聘的经历来说(完全达到了大样本要求):数据分析领域,在正确的发展路径上的,3-7年工作经验是最有价值的。更长工作年限的人选,适配性可能不好,薪资要求也会偏高。”
 
回过头来,有资源,有能力的大厂,应该正视这个问题。格局应该高一点,不管人才能不能长期留住,都要以“为中国经济发展,以自身业务场景为基础,培养数据分析人才。”为责任。踏踏实实分析现有的业务需求和人才成长模型,设计务实、分阶段、可量化、有积累效应的人才成长体系。
目前在数据领域打拼多年,资历颇深的伙伴们,尤其是处在团队管理岗位的伙伴,也应正视这个问题。你们的未来,并不取决于你有多稀缺,有多少好的offer,这些都是暂时的。好好培养身边的新人们,给予更多的引导和帮助。只有帮助他们提高,市场对“数据分析人才”的信心才能维持,整个市场的人才梯度更健康,才能挤压水分,消除泡沫。从长远来看,才有利于行业内所有人的生存。
 

发表评论 共有条评论
用户名: 密码:
匿名发表