数据智能支持决策科学化
【编者按】
数据治理强调顶层设计,战略规划是数据管理活动的总纲和指导,强调数据战略、组织模式、职责分工和标准规范。围绕更好地运用数据治理支持决策,夯实政府和企业的管理建设,零点有数董事长袁岳博士和零点有数副总裁许正军博士共同接受了《新理财》的采访。
《新理财》:如何理解数据与决策的关系?
袁岳:一是看决策。决策是一种过程行为,以事实为依据,结合经验知识进行推理,分析比较不同实现方法的成本、风险、效率、效益等变量的大小,从而选择最优性价比的解决方案。
二是看数据。数据承载着信息,是信息的表现形式和载体。数据可以通过一定的加工处理,将其中信息提炼出来。信息里面又包含着许多客观事物运行的规律,这些规律可以借助以智能算法为主的数据挖掘工具形成知识。数据和信息是不可分离的,数据是信息的表达,信息是数据的内涵。
以数据作为“原料”输入,以智能算法作为工具进行知识挖掘,再将知识应用于实践产生智慧,这便是“数据智能”的核心内涵。
数据与决策。在大数据时代的当下,为了提升决策水平,我们可以采集多源数据(即聚合更多的事实依据和认知能力),运用大数据技术对多源数据进行采集和加工处理,运用人工智能算法进行知识挖掘,并将知识应用于支持决策。反过来,我们又可以用决策后的事实或数据来检验决策模型的优劣,或进一步根据需要进行决策调优。
《新理财》:如何通过数据治理夯实政府或者企业管理体系建设?
袁岳:业内有一句名言,即:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。”其中“特征”是指能反映不同角度不同层面事物信息的数据维度。可见,在支持决策的过程中,大数据作为决策原料至为重要。
我国2015年8月出台的《促进大数据发展行动纲要》中指出:“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。”
可见,数量巨大、来源分散、格式多样是大数据的典型特征。无论是在政府决策还是企业决策中,“对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析”将是数据决策支持过程的关键内容。
政府要发挥数据治理的引领作用,就要通过数据治理体系建设,充分释放数据价值,鼓励政府与企业充分发挥数据价值作用,更好地促进数字政府、数字经济、数字治理和产业数字化转型。同时,也要加强数据安全管理,建立安全负面清单,做好隐私信息保护,让组织和个人的合法权益得到可靠保障,统筹好发展与安全之间的关系。
《新理财》:在您看来,很多政府、企业都想在内部进行数据治理,数据治理难点是什么?
许正军:首先,数据治理是一个复杂的巨系统工程。数据作为一种特殊的要素资产,其治理体系涉及制度建设、法律设立、机制设计等政策层面的顶层设计,也涉及业务数据化、数据业务化和数据价值化等应用层面的具体操作,需要覆盖数据的产生、采集、存储、处理、传输、应用等全生命周期的质量管理、使用监控、市场交易和安全管理等,还涉及数据的归属确权、使用授权、共享与交换机制、交易定价、用后处置等众多方面。
从政府数据治理来看,近年来,政府从顶层设计层面,出台了一系列关于数据治理方面的文件指引,如《政务信息资源共享管理暂行办法》《政务信息资源目录编制指南(试行)》《关于构建更加完善的要素市场化配置体制机制的意见》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等,一方面推动政府部门之间的数据共享和政府数据向社会的开放,将数据作为要素在市场上的交易流动,以充分释放数据价值,促进政府和企业数字化转型,另一方面又要筑牢数据安全和个人隐私保护“红线”。
但具体到应用层面,数据治理困难重重。例如:由“各自为政、条块分割、烟囱林立、信息孤岛”而导致政府部门的数据分散、孤立和碎片化,要摸清政府数据的家底很困难;由于不同部门的垂直业务系统建设层级不同,要实现不同部门之间的“网络通、业务通、数据通”仍然很难,难以实现政府部门之间的数据共享;政务信息资源编目涉及横向协调与纵向一体,协调难度较大;元数据建立难以着手,政务数据共享与开放机制需要各部门各层级协同进行……这些都阻碍了政府数据治理的实际落地。
对企业来说,数据治理既需要企业领导的远见卓识和魄力,又需要企业中高层的协同配合和执行力。伴随业务数据化(业务中台建设)和数据业务化(数据中台建设),数据治理必然引致流程再造,组织变革,一定程度上会打破原有的组织架构和管理体系。在此过程中,企业还需要培养数据治理专业人才。
《新理财》:如何既提高数据质量管理,又确保数据安全?
许正军:如前所述,数据是决策的原材料,企业利用以人工智能算法为主的数据挖掘技术挖掘知识以辅助决策支持。
人工智能技术的应用和实践应以确保数据质量为前提。只有人工智能系统能够获取更为准确、及时、一致的高质量数据,才能提供更有效、有用、精准性高的智能化服务。
由于人工智能的落地应用效果会受到数据质量和安全的影响,因此,数据质量管理和数据安全防护是人工智能技术应用和实践过程中必须做好的两道必答题,这也是一个问题的两个方面,不可割裂开来。因此,在对数据从获取、存储、共享、维护、应用、消亡生命的周期的每个阶段里可能引发的各类数据质量问题进行识别、度量、监控、预警等一系列管理过程中,应加强对每个阶段里可能引发的各类数据安全和隐私侵犯风险进行识别、度量、防护和监管。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。