2025西湖论剑|梅宏:数据要素化面临的挑战
数据要素化面临的挑战
5月10日,“2025中国数谷・西湖论剑大会”在杭州隆重举行。中国计算机学会原理事长、CCF计算机博物馆馆长梅宏在主论坛发表《数据要素化面临的挑战》主题演讲时指出,没有数据就不可能有智能,就像燃料和火箭的关系一样,现在我们经常讲这一轮AI革命的三要素:算法、数据、算力,实际上数据是关键。
数字化转型,需要构建以数据为中心的组织体系和运行模式。当前,我国数字化转型还处于起步阶段,数据资产相关法律还未明确,资产地位没有确立,权属确权没有形成共识,流通交易也缺少规则,利益分配相应机制不够充分。此外,还要面对安全隐私带来的系列问题。



中国计算机学会原理事长、CCF计算机博物馆馆长梅宏

数据要素化需完成“三级跳”蜕变
“数据,只有中国把它列成生产要素,别的国家没有,这是十九届四中全会给出的定义。”梅宏表示,自2019年起,我国积极推动数据要素市场培育。“数据二十条”是中国在数据要素化发展过程中迈出的关键一步。浙江作为“数据二十条”唯一被点名的数据要素市场化先行试点地区,持续进行着探索。
梅宏认为,数据要素化是将数据作为重要生产要素,使其参与社会生产经营的过程,涵盖三个层层递进的层次。首先是数据资源化,需充分认识数据的战略资源属性,若数据被过度封锁,其要素化便无从谈起。其次是数据资产化,即确定数据的资产属性,很多人也在这么做,但到目前为止,数据在法律层面并没有得到资产的保证。最后是数据资本化,这是数据要素化的关键目标,唯有让数据流通起来,方能产生价值。正如国家数据局所致力于解决的问题,数据若不共享、不流通,便如死水一潭,毫无价值可言。
数字化转型的目标是构建以数据为中心的组织体系和运行模式,数据要素化是数字经济发展的必然趋势,其进程与数字化转型紧密相连。数字化转型包含数字化、网络化、智能化三个阶段。数字化阶段将数据转化为可处理的形式,实现基本功能软件化;网络化借助软件定义网络构建数据流通平台,推动组织和流程变革;智能化则着重于充分挖掘数据价值,尤其是生产链数据价值。
然而,当前我国数字化转型仍处于起步阶段,数据资产相关法律亟待完善,数据资产的法律地位尚未确立,权属确权问题尚未形成统一认识,流通交易规则缺失,利益分配机制不够完善,同时还要应对安全隐私方面的一系列挑战。
自 2015 年国务院发布《促进大数据发展行动纲要》以来,我国在数据共享开放领域持续发力。但如今也出现了一些值得关注的问题。一方面,数据共享开放呈现出一定的倒退态势。随着数据重要性的日益提升以及《个人信息保护法》《数据安全法》等法律法规的实施,数据共享意愿有所降低,公共数据开放进程迟缓,数据跨境流动也受到限制。尽管其中涉及安全保密等因素,但如何在数据流动与安全之间寻求平衡,仍是亟待解决的重要课题。另一方面,公共数据授权运用成为各地的主要方式,然而各地成立的数据集团在技术能力和创新体制机制方面存在一定不足。梅宏建议,应对公共数据进行合理分类,开放真正可公开的数据,以激发民间创新活力。

数据质量决定大模型的能力天花板
梅宏在演讲中指出,当前的AI热潮主要是基于深度学习带来的突破性发展,而这些突破性进步也表明,没有数据就不可能有人工智能,二者的关系就像燃料和火箭一样,数据质量定义了人工智能或大模型的能力天花板。
数据的应用一直伴随着人类社会的发展,存在多样性的数据场景。AI发展的三要素包含算法、数据、算力,其中,数据是最关键的。在当下这一轮 AI 蓬勃发展的时期,数据的重要性愈发凸显。深度学习带来了处理分析海量多模数据的高效手段,但数据应用不应仅仅局限于训练模型,传统的数据使用方法依然具有重要价值。不同数据场景应选择合适的应用方式,切不可忽视数据应用的多元性和广泛性,过度依赖大模型。
梅宏呼吁,要进一步优化数据流通的规则和平台,建立科学合理的数据价值评估体系,降低数据交易成本和风险,提高数据流通的效率和安全性。同时,要加强对数据应用的引导和规范,鼓励探索数据应用的多元化场景,充分释放数据在各个领域的价值。
注:根据会议整理,未经本人确认