通信世界网消息(CWW)随着“数据要素X”“人工智能+”计划的推出,新一轮技术对产业发展产生了变革性的影响。5月15日,由中国通信标准化协会主办,中关村科学城管委会支持、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)承办的“2024DataOps发展大会”举办。大会围绕“DataOps”及“人工智能数据治理”两大模块展开,聚焦数据治理领域前沿话题,发布并解读多项研究成果,以期进一步激活数据要素潜能。
中国信通院云计算与大数据研究所(下称“云大所”)副所长闵栋表示,DataOps是有效推动工具、流程和人员等资源的优化重组,提升协同效率的方法论,DataOps将为数据引擎换挡提速;人工智能技术的高速发展也为数据治理领域注入了新的活力。中国信通院将围绕国家重大数据战略,持续深耕数据要素理论研究、积极支撑数据发展的产业实践、集智攻关数据生产力价值释放,为数字经济发展和数据要素产业实践积极提供智力支撑。
《DataOps实践指南2.0》等发布
中国信通院云大所大数据与智能化部主任姜春宇、高级业务主管尹正分别进行了《DataOps实践指南(2.0)》及《DataOps标准-交付管理》的发布与解读。
数据驱动时代,业务需求快速变化,数据处理流程纷繁复杂,企业必须处理好旺盛数据需求与数据生产力不足之间的矛盾,革新数据开发流程,加大数据供给力度,从而更好地响应需求、赋能业务发展。人人用数的场景下,传统数据开发范式开始出现效率瓶颈,需要引入敏捷、协作、精益等新的理念以寻求变革。DataOps作为一种新的数据开发模式,通过构建高效协同机制,建立精细化数据运营体系,打造规范化、一体化的数据开发流程,实现数据产品高质量与高效率地交付。
当前,国内处于DataOps实践的快速发展阶段,其概念和实践方法论初具雏形,仍需进一步引导企业进行实践。历经一年时间的打磨,实践指南重磅升级,此次大会正式发布《DataOps实践指南2.0》,从能力框架解读、实践初探、典型误区及未来展望几个方向指引企业进行DataOps落地应用,从而更高效地发挥数据价值,进一步优化企业运行效能。《DataOps标准-交付管理》从配置管理、测试管理、部署与发布管理三大能力域切入,针对数据交付核心环节的要求进行进一步明确,帮助企业构建集管理、协同、技术能力于一体的全方位数据交付能力。
具体来看,在能力框架方面,实践指南在1.0的基础上对DataOps能力框架进行了进一步解读。详细阐述了数据研发管理、数据交付管理、数据运维、价值运营四大核心环节的发展现状,列举了先行企业的建设成果,进一步给出方向性的指导。针对系统工具、组织管理、安全管控三大实践保障,给出具体能力要求,为业界DataOps能力建设提出了重要参考。
在实践初探方面,工作组对企业实践的广泛调研中发现,企业在实践DataOps理念的过程中展现出了不同的建设特点,从敏捷数据开发能力建设、数据文化渗透、跨域协同优化、数据研发治理流水线搭建四个方面总结了四大特征,分析了DataOps建设现状。
在实施典型误区方面,DataOps作为一种新的数据开发范式正在越来越多的行业和企业中落地,但在实施过程中也面临重重困难。实践指南梳理总结了目前DataOps建设过程中出现的问题与挑战,为计划建设DataOps的企业“避坑”,并进一步结合行业内的经验给出方向性解决思路。
展望未来,信通院将以数据产业发展为核心,围绕数据流程可观测、数据工程智能化、数据价值精准量化三个维度研判DataOps产业发展趋势,预见DataOps发展趋势。
会议现场,中国信通院颁发了第二批“DataOps证书”,北京银行、中信建投、联想、网易、火山引擎分获“研发管理”及“系统工具”能力证书。此外,大数据技术标准推进委员会还授予12位业内专家“DataOps专家”荣誉证书。
《面向人工智能的数据治理实践指南(1.0)》等发布
中国信通院云大所大数据与智能化部副主任王妙琼、工程师林木森分别对《面向人工智能的数据治理实践指南(1.0)》及《智能化数据治理技术工具要求》进行了解读。
面向人工智能的数据治理(DG4AI,Data Governance for Artificial Intelligence)是指在人工智能应用中管理和控制数据的过程与实践,以确保数据的质量、可靠性、安全性与合规性,使得数据能够被准确地用于训练和部署AI模型,同时保护数据的隐私和安全。
《指南》从“数据治理”的发展历程展开,点明当前大模型时代数据治理遇到的问题,后对于“面向人工智能的数据治理”概念进行定义,并从不同维度分析面向人工智能的数据治理与传统的数据治理的差异。
《指南》将人工智能数据治理阶段划分为“数据收集”“数据预处理”“模型推理”等9个阶段,提出治理对象包括“原始多模态数据集”“标签数据集”“训练数据集”等4类对象。而后明确每个阶段对应的治理目标与方法。
《指南》明确面向人工智能数据治理的三大主要工作,即“数据质量”“数据安全与隐私”“数据伦理”,并为企业提供“治理方法”“技术手段”的实践指导。《指南》还梳理了企业在整个治理过程中应遵循的治理步骤,覆盖从“明确应用目标与需求”到“持续数据集运营与优化”的五个阶段,为企业实践提供方法论的指引。
每年的ipad有什么不同
结合当前人工智能产业的技术发展趋势,《指南》提出数据治理对企业竞争力提升的重要性。未来,随着技术的快速发展与实践的进一步落地,数据治理将推动人工智能应用的高质量发展,人工智能数据产业的分工也将更加明确。
在以大模型为代表的强人工智能技术快速发展的背景下,《面向人工智能的数据治理实践指南(1.0)》以数据治理为切口,通过对面向人工智能的数据治理产生的背景、遇到的挑战进行分析,提出了面向人工智能研发应用全生命周期的治理实践,创新性的为业界提供了系统化的治理实践方法,为人工智能场景中数据治理路径指明了方向,使数据治理的价值能够在时人工智能时代背景下最大化激活。《智能化数据管理工具能力要求》为企业构建智能化数据治理体系提供统一思路,细化智能化技术的应用场景,助力企业健全数据治理体系,为企业提升数据“智”理水平提供新的思路。