数据空间
治理技术
您当前的位置: 首页 /数据质量

数据治理之数据质量(一)

发布时间:[2017-02-23] 来源:作者:杜森 点击量:

  这篇文章写于2011年,已经有4年的时间,也曾经在一些刊物上发表。上个月有幸看到有个农商行正是参照这个思路进行了数据质量的相关建设。特借助中国企业数据治理联盟的力量,希望向更多的人进行分享。

  数据治理作为近两年来的IT热词之一,不断地成为各个研讨会、主题交流会的主角,数据治理作为IT治理核心组成部分,受到各界的重视是理所当然的。在建立治理委员会,订立治理章程之后,很多的组织都面临着如何使数据治理有计划、有步骤、有重点落地的问题。
根据TDWI的统计,在一组受访者中,超过65%的被访者认为数据质量问题是数据治理的核心问题之一,位列第一,第二位是数据仓库、商业智能,第三位是合规与风险,第四位是企业架构,第五位是信息安全。

数据质量.jpg

  这个统计结果在日常工作中也不断得到印证。多数组织在数据治理的框架下,尤其是完成数据仓库项目后,最高优先级的活动都聚焦在如何提供“可信赖的”数据问题上。从常理来看,这也是IT进化过程的一部分,从十几年前开始建设数据仓库开始一直到今天,很多企业仍然面对数据仓库利用率不高、建设效果不明显,一期、二期、三期重复建设的问题。是什么原因造成了这样的问题?有历史上的技术限制、架构问题、模型问题等等一系列问题,但有一个最重要的问题不可忽视,那就是数据质量问题。引用《穷爸爸富爸爸》中富爸爸的一句话:“如果你要建帝国大厦,你要做的第一件事就是挖个深坑,打牢基础。如果你只是想在郊区盖个小屋,你只须用6 英寸厚的水泥板就够了。”数据质量是数据仓库的基石,没有好的数据质量,数据仓库的大厦很难建成。
解决奶粉“被信任”的问题是质量问题,解决 IT系统“被信任的”问题是数据质量问题。数据质量问题解决需要:理解数据质量;解决如何让数据质量“落地”。

数据质量说

  在人体里,流淌着的是血液;在IT系统中,流淌着的是数据,因此很多时候我们把数据比作IT的血液。多数组织IT环境中的系统软件,如银行核心、电信BOSS无一不是外购或由集成商开发。由于软件本身的复杂性,其实我们只是这些产品的使用者,核心资产仍属于软件厂商或者集成商,只有其中的数据才是企业的核心资产。

  数据之于IT,血液之于生命,思考数据质量问题,解决数据问题,需要关注以下几点:

1.让“数据体检”成为常态。
2.
如何生成数据的“体检报告”。
3.
复杂的数据质量问题。
4.
治疗数据的“专科医生”。
5.
数据质量“预防为主”。
待续,如何 进行数据体检,如何整理数据体检报告................

 


发表评论 共有条评论
用户名: 密码:
匿名发表