
东旭集团成立于1997年,总部及研发中心位于北京,是集光电显示、新能源、装备制造、金融、城镇化地产等产业集群为一体的多元化企业集团,拥有三家上市公司(东旭光电000413、宝安地产000040、嘉麟杰002486)和二十余家全资及控股子公司,员工1万多人。
东旭集(ji)团经营范围复杂主(zhu)要涉及(ji)(ji)(ji)到以自(zi)有资金对项目(mu)投资;机械设备及(ji)(ji)(ji)电(dian)子产(chan)品(pin)(pin)的研(yan)发(fa)(fa);各(ge)类非标设备及(ji)(ji)(ji)零部(bu)件产(chan)品(pin)(pin)的生产(chan)及(ji)(ji)(ji)工(gong)艺制(zhi)定;研(yan)磨材料机电(dian)产(chan)品(pin)(pin)(不(bu)含公共(gong)安全设备及(ji)(ji)(ji)器(qi)材)零部(bu)件加工(gong)销售;自(zi)营和代理各(ge)类商(shang)品(pin)(pin)及(ji)(ji)(ji)技术的进(jin)出口业(ye)务(wu);计算机系统(tong)集(ji)成,软件开(kai)发(fa)(fa),技术咨(zi)(zi)询;机电(dian)设备的安装(zhuang),工(gong)程咨(zi)(zi)询等业(ye)务(wu)。


随着企业信息化进程的不断推进,不同职能部门为解决其业务需求也在不断的完善相应的业务系统,例如HR系统、资产管理系统、合同管理系统、财务管理系统等等。
各业务系统虽然能够完成当下的业务需求,但是也带来了新的问题:例如多个系统间的数据不能有效的共享,没有规范的录入要求,各业务系统之间的数据存在多种规则,数据的重复录入等等。
举例来说:资产管理系统录入资产卡片后需要手工填列会计凭证号,但是财务系统每记一笔账都会生成相应的会计凭证号,如此操作首先增加了负责管理物资的人员的工作量,另外手工填列也不能保证数据的准确性。还比如:公司要求出年终报表,报表反映了整个集团公司的数据,但各业务系统只能提供出简单的数字来支撑,如此一来问题接踵而至,填表人需协同各业务部门提供数据,无形之中增加了两个部门的工作量,手工填列又会出现录入错误的问题,各个部门提供的数据也不能体现出相应的勾稽关系,数据质量得不到保证。
随着数据问题的不断出现,企业领导人也深切的体会到了,数据不应该是单个部门的业务数据,而是应该互相配合,达到1+1>2的结果。各个部门的数据应该像一辆汽车,有发动机、传动系统、转向机构、制动模块、地盘、电子电器、车身、外观内饰,这些模块互相配合才能让一辆车跑的动跑的快跑的舒服。

有问题就有解决方案,根据东旭集团现有的数据问题,我司为其制定了相应的数据治理方案。方案如下:
一、数据治理项目建设思路
为保证东旭集团数(shu)据治(zhi)理平台建设(she)(she)项目的成(cheng)功(gong),我们提出如下项目总体建设(she)(she)思(si)路:“明确目标、界定范围、合理规划、高(gao)效实(shi)施(shi)”。
二、数据管理体系梳理原则
结合(he)中(zhong)翰软件10多年来(lai)数据治(zhi)理(li)的经验,且参照了国家信(xin)息化相关标(biao)准(zhun)体系(xi)、相关行业的标(biao)准(zhun)体系(xi)以及针(zhen)对东(dong)旭集团各业务部门的现状、需求的整理(li)分析、汇总从而进行专项(xiang)整治(zhi)。
三、数据编码确立
从(cong)编(bian)码(ma)(ma)规则、编(bian)码(ma)(ma)方(fang)法、编(bian)码(ma)(ma)方(fang)式、编(bian)码(ma)(ma)要(yao)求、编(bian)码(ma)(ma)结构的展现(xian)这(zhei)五个不(bu)同角度与(yu)编(bian)码(ma)(ma)整个编(bian)码(ma)(ma)的生(sheng)面周期来考虑(lv)结合集(ji)团实(shi)际情况(kuang)来进行实(shi)施。
四、数据分类体系确立
首先从数(shu)据(ju)的(de)(de)纬度(du)、粒度(du)的(de)(de)角度(du)达到数(shu)据(ju)的(de)(de)统一,避免(mian)其(qi)它类(lei)的(de)(de)出现,另外允许多(duo)类(lei)别结构的(de)(de)出现,达到规范(fan)、灵活的(de)(de)结果。
五、数据模型确立
分别制定组织、人员、客商、科目、银行类别不同的(de)数(shu)据模型(xing),使(shi)模型(xing)更明确精准。
六、建立数据相关制度
例如《数据管(guan)(guan)理制度》、《数据质(zhi)量管(guan)(guan)理标准》、《数据安全管(guan)(guan)理标准》。
七、数据运维管理体系
数据运维管理体系确立原则:最大化减少平台实施后的运维工作量;最大化延续项目咨询过程的详细思路;运维时可以随时在线查阅数据管理体系的咨询过程。
数据运维管理体系建设策略:建立静态数据中心,实现数据模型体系的最大化,减少后期数据模型的变动几率;建设在线知识库,实现知识转移的实时化;平台试运行期间,强化数据管理的思路、逻辑。
八、历史数据清洗解决(jue)方案
数据(ju)(ju)类型包括:客商数据(ju)(ju)、人员(yuan)数据(ju)(ju)、银(yin)行类别、银(yin)行账户、科目数据(ju)(ju)等,这些数据(ju)(ju)的特点是模型单(dan)一,数据(ju)(ju)清洗较(jiao)简单(dan)。具(ju)体(ti)操作为先(xian)查(cha)(cha)重(zhong)再(zai)完善方式,即为先(xian)查(cha)(cha)找重(zhong)复(fu)项,然后进行数据(ju)(ju)信(xin)息(xi)的自动和手段完善。
查重的方式是根据相似度进行模糊匹配和完全匹配等,信息完善是通过系统自动和手动进行的。排重分为三个部分,排重规则,排重结果,排重详情。任务:分为单独、合并两种模式。编码:分为单独、合并两种模式。追加映射:选中未清洗数据,选择一条已经清洗的数据作为主任务单,将未清洗数据追加到已经清洗的数据上。
九、数据日常管理解决方案
主要包括(kuo)公有数(shu)据的申(shen)请(qing)、修(xiu)改、更新(xin)、审核等过程(cheng)的科学化管理:
1.单(dan)人或(huo)多人协同(tong)新(xin)增数据信息
2.多人多级会签的数据审核过程
3.专业针对企业内部的(de)数据(ju)批(pi)量(liang)更新(xin)
十、数据保养解决方案
数据(ju)(ju)治(zhi)理后如何保证数据(ju)(ju)质量长(zhang)期(qi)处于(yu)良(liang)好(hao)状态,目前已经成(cheng)了很多数据(ju)(ju)项(xiang)目实施后的企(qi)业的头等大事,数据(ju)(ju)保养阶段随(sui)之而来。
中(zhong)翰软件建(jian)立了数据管理(li)云中(zhong)心,帮助企(qi)业提(ti)供数据质(zhi)量(liang)实(shi)(shi)时在线监(jian)测分(fen)析的(de)标(biao)准,实(shi)(shi)时监(jian)控企(qi)业数据质(zhi)量(liang)现状(zhuang)分(fen)析,并根据数据质(zhi)量(liang)问题做出(chu)准确的(de)处理(li)(清洗)。
十一、数据交换解决方案
数据类型:人员、组织、客户、供应商、科目、银行类别、银行账户。
数据交换对接机制:数据实时交换,数据治理平台实时监测调用业务系统接口时对方系统是否有反馈。若因网络等其他原因发生接口不通畅,以30秒为界定,超过则自动断开接口调用。在数据治理平台记录失败日志信息,以供下次系统自动处理再次调用。
交(jiao)(jiao)换节(jie)点之(zhi)间数据交(jiao)(jiao)换采用中(zhong)心交(jiao)(jiao)换模(mo)式,数据由一个交(jiao)(jiao)换节(jie)点传输(shu)到交(jiao)(jiao)换中(zhong)心后再传输(shu)给另一个交(jiao)(jiao)换节(jie)点,所交(jiao)(jiao)换数据需(xu)要存储在交(jiao)(jiao)换中(zhong)心。

在这样的解决方案下企业最后达到了:
1.上线了数据治理平台。

2.数据清洗八万条、解决了静态数据不一致、不完整、不规范、有冗余的问题。
3.制定了数据整个生命周期的规范,并形成了制度手册:《数据管理制度》、《数据流程》、《数据交换规范》。
4.数(shu)据治理效果明显,大大提高了静态数据的重用率,避(bi)免了大量的重复工作,规范了静态数据的录入规则,使各业务系统数(shu)据(ju)交流更顺畅(chang),完善了静态数据信息项,使静态数据(ju)可用性(xing)更(geng)高,处理了冗余数据的情况,使(shi)统计数据(ju)更准确(que),更好的(de)为领导决策提供(gong)数据(ju)支持。