首页 >> 产业 >> 产业 >> 正文
中国工程院院士邬贺铨:可信数据空间的功能与挑战
  • 工联网
  • 2025年7月18日 11:47

工联网消息(IItime) 近日,在2025全球数字经济大会数据要素发展论坛上,中国工程院院士邬贺铨发表了“可信数据空间的功能与挑战”的演讲。邬贺铨表示,可信数据空间类似于一个“有围栏的数据沙箱”,数据提供方和使用方均可接入其中,同时也可以设置专门的运营方。其核心功能是允许数据在空间内进行授权计算,计算结果可供提供方和使用方获取,而数据本身则保持“可用不可见”,这是可信数据空间最为关键的特性。

可信数据空间的细分功能

邬贺铨认为,可信数据空间的主要功能可进一步细分为以下八个方面:

一是数据源认证与接入身份认证。通过IPv6技术,不仅可以验证数据包的来源和去向,还能对数据包的所有者进行认证,同时附加用户群ID、应用感知ID等信息,以满足数据传输对服务质量的要求。

二是数据源目录管理。提供数据源目录,便于快速检索数据。

三是数据格式与协议转换。提供数据格式和协议转换软件,以适应不同格式的数据处理需求。

四是数据脱敏与去标识化。对敏感数据进行过滤和去标识化处理,确保数据安全。

五是算力与数据挖掘工具支持。提供算力和数据挖掘工具软件,方便数据开发。

六是计算模式支持。支持明文计算、解密计算以及同态加密计算等多种计算模式。

七是数据沙箱与安全合规管理。构建数据沙箱,实现数据流通的安全合规管理。

八是存证审计与交易清算结算服务。提供数据流通的存证审计和交易清算结算服务。

可信数据空间面临的挑战

邬贺铨表示,可信数据空间主要面临以下挑战:

数据源认证的挑战。因为身份信息由使用者填写,存在虚假信息的风险,所以使得数据源身份的准确性难以保证。此外,数据源身份过于透明可能带来安全隐患,需要在透明与安全之间找到平衡。

数据使用规则的挑战。数据提供方需限定访问权限,使用方需遵守规则,运营方负责监督规则的执行。当多个提供方规则不一致时,可能出现不协同问题。数据提供方和使用方可能同时具有多种身份(如既是提供方又是使用方或运营方),如何在多身份情况下保证机制的有效性是一个挑战。

数据分类与格式转换的挑战。数据类型繁多,包括结构化、半结构化、非结构化数据,以及热数据、冷数据等。分类过细可能带来安全风险,需要权衡分类的细致程度。不同格式的数据需要进行格式转换,但格式转换过程中可能存在数据泄露风险,尤其是中小企业作为提供方时,可能需要运营方完成格式转换,如何保证运营方的数据安全是一个问题。

数据脱敏与隐私保护的挑战。数据脱敏需要去标识化或匿名化处理,跨境数据传输时需满足更高的匿名化要求。沙箱本身虽有脱敏功能,但中小企业可能依赖沙箱完成脱敏,如何确保脱敏过程的安全性和有效性是一个挑战。

算力与数据挖掘工具的挑战。可信数据空间需提供算力支持,但不同方(提供方、使用方、运营方)的算力可能异构,如何实现异构算力的协同计算是一个问题。

数据加密与计算模式的挑战。数据加密后可在可信数据空间内进行解密计算,但同态加密虽然安全性高,复杂度和成本也高,且可能牺牲部分计算细节。如何在成本与安全性之间找到平衡是一个挑战。

数据沙箱与安全合规管理的挑战。数据沙箱需要具备加密网关、隐私计算节点和区块链存证等能力,但沙箱本身是一个“黑匣子”,审计过程难以透明化,如何实现有效的审计是一个挑战。同时,在数据跨境流动时,如何识别个人数据并进行合规管理,以及如何实现对境外使用者的管辖,都是需要解决的问题。

中小企业应用门槛的挑战。可信数据空间的应用对中小企业存在一定经济和技术门槛,如区块链和联邦计算的部署成本较高,且需要一定的技术人才支持。如何降低中小企业应用可信数据空间的门槛,是未来发展的一个重要方向。

可信数据空间的发展趋势与建议

一是技术创新与自主可控。重视可信数据空间的底层关键技术、算法和芯片的自主创新,加强对运行模式及相关技术的开发。

二是安全与合规同步部署。将可信数据空间的构建与网络安全部署同步实施,确保数据安全和合规性。

三是试点探索与生态建设。通过试点探索,积累经验,逐步完善可信数据空间的应用生态。政府和产业链主要企业应带动中小企业参与,通过算力券、补贴等方式降低中小企业应用门槛。

四是引入智能体(Agent)。未来可信数据空间应引入智能体,实现自动数据发现、模型选择和违规合规管理,提高应用的智能化水平。

“可信数据空间作为新型数据基础设施,是国家数据要素体系的重要组成部分。通过其部署和应用,可以有效解决企业数据‘不会用、不能用、不敢用’的问题,激发数据要素价值。然而,其发展过程中仍面临诸多挑战,需要各方共同努力,推动其健康可持续发展。”邬贺铨如是说。

编 辑:程琳琳
分享到: