数据分析与知识发现, 2022, 6(1): 2-12 doi: 10.11925/infotech.2096-3467.2021.1411

专题

打造面向全国统一数据要素市场体系的国家数据要素流通共性基础设施平台*——构建国家“数联网”根服务体系的技术路径与若干思考

窦悦1,2, 易成岐2, 黄倩倩2,3, 莫心瑶4, 王建冬,,2, 于施洋2

1北京大学信息管理系 北京 100871

2国家信息中心大数据发展部 北京 100045

3中国人民大学信息资源管理学院 北京 100872

4深圳市数聚湾区大数据研究院研究咨询部 深圳 518048

Constructing a Common Data Circulation Infrastructure Platform for the National Unified Data Factor Market——Technical Path and Policy Thinking of Constructing the National “Data Networking” Root Service System

Dou Yue1,2, Yi Chengqi2, Huang Qianqian2,3, Mo Xinyao4, Wang Jiandong,,2, Yu Shiyang2

1Department of Information Management, Peking University, Beijing 100871, China

2Department of Big Data Development, State Information Center, Beijing 100045, China

3School of Information Resource Management, Renmin University of China, Beijing 100872, China

4Department of Research and Consulting, Greater Bay Area Big Data Research Institute, Shenzhen 518048, China

通讯作者: 王建冬,ORCID:0000-0001-6819-6765,E-mail:wangjd@sic.gov.cn

收稿日期: 2021-12-15   修回日期: 2021-12-25  

基金资助: *本文系国家社会科学基金青年项目的研究成果之一(18CSH018)

Corresponding authors: Wang Jiandong,ORCID:0000-0001-6819-6765,E-mail:wangjd@sic.gov.cn

Received: 2021-12-15   Revised: 2021-12-25  

Fund supported: National Social Science Fund of China(18CSH018)

摘要

【目的】 打造面向全国统一数据要素市场体系的国家数据要素流通共性基础设施平台,围绕人、企、车、物、地等基础对象建立数据资源标识统一编码解析体系,引导各方加强数据要素流通全流程中的分类分级标识标定管理,支持提供数据登记备案、供需撮合、信用评估、合规公证、资产评估等共性公共服务,促进全国范围内跨地区、跨行业的数据要素流通交易平台互联互通和融合发展,为参与数据交易各类市场主体提供安全可信流通环境和共性公共服务。【方法】 梳理近几年国内外数据流通交易相关技术研究及应用现状,结合当前国内数据要素市场建设面临的共性问题,提出国家“数联网”根服务体系总体架构。【结果】 明确以数据标识融合、跨区块链及跨隐私计算平台基础支撑体系为依托,以数据流通交易公共服务体系为载体的国家“数联网”根服务体系总体建设思路。【局限】 需进一步研究论证目前提出技术路径的完备性、可扩展性。【结论】 提出的国家“数联网”根服务体系对打造国家数据要素流通共性基础设施,面向社会提供安全可信的共性公共服务和培育数据要素市场与产业生态具有重要作用。

关键词: 数据要素; 数联网; 流通交易; 根服务体系; 公共服务

Abstract

[Objective] This paper is to construct a common data circulation infrastructure for the national unified data factor market. Establish a unified data identification coding and analysis system of basis data objects such as people, enterprises, cars, things and places. Guide all parties to strengthen the management of data classification, grading and identification calibration during the whole process of data factor circulation. Give support to provide common public services, such as data registration and filing, supply and demand matching, credit evaluation, compliance notarization, asset evaluation, etc. Promote the interconnection and integration development of nationwide cross-regional and cross-industry data factor circulation trading platforms. Provide safe and credible circulation environment and common public services for various market entities involved in data transactions. [Methods] We conduct a literature review on the recent development of related technologies to promote data circulation and transaction at home and abroad. Given the common difficulties the domestic data factor market construction comes across, we propose the national “data networking” root service system. [Results] This paper clarifies the construction ideas the national “data networking” root service system, with data identification fusion, blockchain interoperability and privacy preserving computing platform interoperability served as the basic support and the public service system of data circulation and transaction served as the carrier. [Limitations] Further research is needed to demonstrate the completeness, scalability and robustness of this proposed technical path. [Conclusions] The proposed national “data networking” root service system plays an important role in building the common data circulation infrastructure platform, providing safe and credible common public services and cultivating the data factor market and industrial ecology.

Keywords: Data Factor; Data Networking; Circulation Transactions; Root Service System; Public Service

PDF (1284KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

窦悦, 易成岐, 黄倩倩, 莫心瑶, 王建冬, 于施洋. 打造面向全国统一数据要素市场体系的国家数据要素流通共性基础设施平台*——构建国家“数联网”根服务体系的技术路径与若干思考[J]. 数据分析与知识发现, 2022, 6(1): 2-12 doi:10.11925/infotech.2096-3467.2021.1411

Dou Yue, Yi Chengqi, Huang Qianqian, Mo Xinyao, Wang Jiandong, Yu Shiyang. Constructing a Common Data Circulation Infrastructure Platform for the National Unified Data Factor Market——Technical Path and Policy Thinking of Constructing the National “Data Networking” Root Service System[J]. Data Analysis and Knowledge Discovery, 2022, 6(1): 2-12 doi:10.11925/infotech.2096-3467.2021.1411

1 引言

党的十八大以来,我国数字经济蓬勃发展,对构建现代化经济体系、实现高质量发展的支撑作用不断凸显。近年来,党中央、国务院高度重视数字经济高质量发展和培育数据要素市场等有关工作。2019年10月,党的十九届四中全会首次将数据与劳动、土地、知识、技术和管理并列作为重要的生产要素。2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》强调要加快培育和发展数据要素市场。2020年11月,《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》明确提出“建立数据资源产权、交易流通、跨境传输和安全保护等基础制度和标准规范,推动数据资源开发利用”,对数据要素市场培育工作做出更加明确的战略性部署。从各地应用实践来看,政府与社会机构纷纷发起组建各类数据交易场所和数据交易平台,既有由地方政府主导或支持的区域性数据交易机构或场所,较典型的如北京国际大数据交易所、贵阳大数据交易所、上海数据交易所等,也有依托知名企业自身庞大的云服务和数据资源体系独立运营的数据交易生态平台,较典型的如京东万象、百度AI市场、浪潮天元、阿里数+等。当前我国数据要素市场总体上处于起步发展阶段,数据要素市场培育工作依然存在统筹规划不够、生态培育不足、标准规范缺失等问题。各自为营的数据交易场所及平台建设可能会形成新形态的数据孤岛,导致场所之间、平台之间无法互联互通。针对这些问题,需要在国家层面打造面向全国统一数据要素市场体系的国家数据要素流通共性基础设施平台,为参与数据交易的各类市场主体提供安全可信流通环境和共性公共服务,有效促进全国范围内跨地区、跨行业的数据要素流通交易平台互联互通和融合发展。基于此,本文提出构建国家“数联网”根服务体系,期望对打造国家数据要素流通共性基础设施提供有益参考。

2 数据流通交易领域技术研究综述

促进数据安全可信流通交易的技术手段主要涉及区块链、隐私计算和标识融合三方面。

2.1 区块链技术在数据流通交易领域的研究与应用

区块链具有去中心化存储、难以篡改等独特优势,其构建的新型信任机制可以从交易模式上改变当前数据交易权属难界定、信任机制难建立的现状[1],促进数据安全可信流通交易。目前,国内外学者对区块链技术在数据流通交易领域的研究主要集中在以下三个方面。

(1) 基于区块链技术的数据交易平台总体架构设计研究。杨茂江[2]引入区块链技术和思想,提出包含公共区、成员区、节点设备三部分的去中心化数据交易平台架构方案,降低了数据被交易平台复制和留存的风险。夏俊杰等[3]利用区块链技术设计了包含基础设施层、网络层、合约层、服务层、展示层的5层架构数据交易系统,实现了数据治理和数据资产保护功能,并论证了该系统可在高负载、高并发状态下保持高效可靠运行。汪靖伟等[4]认为在数据交易平台中部署区块链要权衡其可扩展性、去中心化和安全性之间的关系,围绕这一目标,研究设计了基于以太坊私链的数据交易市场系统。

(2) 利用区块链技术解决数据流通交易确权难、隐私风险等关键问题研究。针对数据交易确权难问题,王海龙等[5]基于区块链与数字水印技术,探索形成一套具有确权公平性、完整性、不可欺骗性的大数据确权方案,该方案能够协同保证确权结果的一致性;张婷[6]利用区块链、数字签名和非对称数字加密等技术,设计提出了数字资产确权交易模型,有效提高了交易系统的安全性能。针对数据交易中的隐私保护问题,王瑞锦等[7]研究阐释了数据流通中的隐私风险,提出一种利用区块链与同态加密融合技术,将隐私数据加密后再上链存储的可行性方案,能够增强敏感数据的加密性和安全性。

(3) 利用跨链技术实现不同区块链平台间业务信息流转的研究。目前主流的跨链技术研究方向包括公证人机制、侧链/中继、哈希锁定、分布式私钥控制、公证人+侧链混合机制等[8]。Wang[9]将跨链技术分为基于链的互操作性、基于桥的互操作性和基于DAPP(去中心化应用)的互操作性。Polkadot平台[10]内嵌了一套异构多链系统,包含中继链、侧链和连接桥三部分,能够实现跨链信息安全通信。跨链技术平台BitXHub[11]提出了一种通用的链间消息传输协议IBTP,该传输协议结合侧链中继技术,能够实现异构链的资产互换、数据互通及服务互补。此外,目前业界主流的跨链平台还包括Cosmos[12]、BTC Relay[13]和WeCross[14]等,通过调研发现,上述跨链平台仍然存在扩展性、稳定性不足等实际问题,仍有较大提升空间[15]

2.2 隐私计算技术在数据流通交易领域的研究与应用

隐私计算也被称为隐私保护技术、隐私保护计算,是面向隐私信息全生命周期的隐私保护计算理论和方法[16],目前主流的隐私计算技术可分为以多方安全计算(MPC)为代表的密码学技术和以可信硬件为载体的可信执行环境技术(TEE)两大领域[17]。通过调研隐私计算相关文献资料发现,目前国内外学者对隐私计算在数据流通交易领域的研究主要集中在以下两个方面。

(1) 通过优化隐私计算算法,推进隐私计算技术产品落地应用,提升数据流通隐私保护能力研究。理论研究层面,符芳诚等[18]梳理总结了近年来隐私计算在隐私集合求交技术、联邦学习、异步并行计算、可信执行环境等关键技术的创新成果。Arachchige等[19]通过研究联邦学习、差分隐私、区块链等技术的特点,建立了一种融合上述技术的新型隐私计算模型,能够进一步加强数据隐私保护的安全性和可靠性。Huang等[20]结合差分隐私与联邦学习技术,设计出一种包含自适应梯度下降算法的差分隐私专用卷积神经网络的DL-FL框架,能够有效提升隐私计算在不平衡数据集中的表现性能。技术应用层面,目前国内的主流隐私计算平台主要包括:百度MesaTEE安全计算平台[21]、华控清交PrivPy多方安全计算平台[22]、京东数科联邦模盒[23]、微众银行FATE联邦学习框架平台[24]、蓝象智联GAIA金融级隐私计算平台[25]、数牍科技隐私计算平台[26]、富数科技FMPC安全计算产品[27]等。国外的主流隐私计算平台主要包括:OpenMined[28]、Microsoft SEAL[29]、Intel SGX[30]等。总体来说,由于明确的激励机制、收益分配机制与平台收费机制等商业化落地模式尚未形成,隐私计算技术仍处于快速发展的早期阶段。

(2) 基于跨隐私计算平台技术实现数据跨平台互信互通。CCSA TC601、隐私计算联盟联合发布了《隐私计算 跨平台互联互通 第1部分:总体框架》标准,提出了以节点联通实现跨隐私平台联通的两种思路:包括跨平台开发者的算法对齐和跨平台的算法迁移。徐潜等[31]提出了基于中间件与区块链的跨隐私计算平台技术方案,对异构平台基础层、数据层、算法层和应用层4个层面的互联互通进行了设计。徐葳等[32]指出跨隐私计算平台不是要限制和替代已有平台,而是要在现有平台上叠加可管可控的跨平台功能,并提出从控制、数据两个维度进行协议设计。

2.3 标识融合技术在数据流通领域的研究与应用

标识融合技术是指基于多源数据标识的关联融合,使多个标识共同指向同一个实体。目前,国内外学者对标识融合技术在数据流通交易领域的研究主要集中在以下三个方面。

(1) 通过标识匿名化处理增强标识流通融合的安全性研究。主流的标识匿名化处理研究方向包括泛化、分解、聚类、数据交换等匿名技术,以及K-匿名、L-多样性、T-近似等匿名模型[33]。上海数据交易中心与公安部第三研究所联合研制了xID标记技术[34],该技术能实现个人标识信息在各企业之间的隔离加密,增强数据流通安全性。

(2) 通过建立全国通用的标识体系促进多源标识互认连通研究。以工业行业为例,我国正建设工业互联网标识解析体系[35],通过对标识编码进行顶层设计,探索形成兼容Ecode、OID、Handle等现存标识体系的统一标识体系。该标识体系基于多源标识的映射,实现标识对象在不同标识体系间的数据互认,有助于促进数据跨地域、跨行业、跨机构的匹配融合。

(3) 利用算法和数据分析技术实现标识关联研究。目前实现标识互联的常用技术有ID-Mapping[36]、Cookie Mapping[37]和实体解析(Entity Resolution)[38]等。阿里巴巴集团[39]设计了增强的ID-Mapping技术,通过挖掘标识之间的关联,实现标识匹配,并基于生成的UID对实体进行唯一编码,实现不同系统间的数据融合流通。58集团[40]采用共现ID关联的方式构造ID关联图谱,构建了关联整个集团各类标识的ID-Mapping架构,实现58同城、赶集、安居客等核心数据源的标识关联。

综上所述,区块链、隐私计算与数据标识融合三项技术在数据流通交易领域发展较快。然而,区块链技术仍需继续加强跨区块链技术研究和架构设计。目前市场上已经形成大量相互独立的区块链系统,且大部分区块链系统是一个确定的、封闭的系统环境,难以进行链内外的数据交互;隐私计算技术中的异构隐私计算平台的互联互通研究刚刚起步。不同的隐私计算平台的算法原理和系统设计不一致,使得异构平台间难以进行信息的交互,容易形成数据壁垒;数据标识融合技术在数据流通交易领域的全国性通用标识融合技术体系研究不足。不同机构使用的数据标识融合技术不一,标准规范存在差异,数据难以互通,难以实现数据跨地域、跨层级、跨行业的流通交易。由此可见,三项技术的实际应用仍无法适应数据要素市场的快速发展,亟需构建具备三大底层技术基础支撑体系的数据要素流通共性基础设施平台。

3 国家“数联网”根服务体系的总体架构

为促进全国统一要素市场体系形成,本文提出构建国家“数联网”根服务体系的总体架构。探索设计跨区块链基础支撑体系,构建统一规范的跨链标准,提升异构区块链的互操作性,促进跨链信息的流转;探索设计跨隐私计算基础支撑体系,实现数据跨平台的互信互通,促进数据流通交易;探索设计标识融合基础支撑体系,建立通用的数据标识编码规范和协议,实现多源数据标识互认,推动数据融合流通。

3.1 总体架构

国家“数联网”根服务体系的总体架构如图1所示,共分为三个层级,即数据资源层、流通环境层和公共服务层,总体设计思路可以概括为“一核两翼N点”,其中,“一核”是指在数据资源层,利用数据标识编码融合实现数据资源层面的互信互通;“两翼”是指在流通环境层,通过跨区块链存证溯源和跨隐私计算互信互通,促进跨地区、跨行业数据流通交易环境的互联互通融合发展;“N点”是指在公共服务层,依托“一核两翼”实现统一数据登记备案、数据供需智能撮合、数据信用综合评估、数据合规审核认证、数据要素综合评估等N类公共服务。此外,国家“数联网”根服务体系将围绕国家重大区域战略布局区域节点,为全国统一数据要素市场体系中的各类主体及数据公证、数据审计、数据集成、数据仲裁、数据保荐等多元生态体系增效赋能,促进实现全国统一数据要素市场体系“强基座、育生态、统标准、促连通”的优势作用。

图1

图1   国家“数联网”根服务体系总体架构设计

Fig.1   Structure of the National “Data Networking” Root Service System


3.2 数据标识融合基础支撑体系

在国家“数联网”根服务体系数据资源层面,为有效促进多源异构数据互联互通,推动跨机构、跨行业、跨层级的数据关联融合分析,数据标识融合基础支撑体系的架构设计思路如图2所示,其技术实现路径主要包括“三个环节”与“两项支撑”,具体为标识编码解析、标识匿名化处理、标识关联融合三个环节,以及标识规则体系、标识存储管理两项支撑。

图2

图2   数据标识融合基础支撑体系架构设计

Fig.2   Structure of Data Identification Fusion Basic Support System


对于不同来源、不同类型、不同特征的多源异构数据,国家“数联网”根服务体系将建立统一标识规则体系,利用标识编码解析技术对数据资源进行统一标识编码,其中,标识规则体系如表1所示,共分为5个层级,分别是国家“数联网”根服务体系国家级节点(顶级节点);聚焦人、企、车、物、地等不同本体对象的二级节点;聚焦区域或行业的三级节点;聚焦各类组织机构的四级节点和聚焦某一独立个体的五级节点。将人、企、车、物、地等不同本体对象设定为二级节点的主要考虑是目前难以直接对数据资源进行统一标识编码,但能够先将数据资源对应至所属的相关本体对象中,再对其进行标识编码管理。

表1   国家“数联网”根服务体系标识规则体系层次设计

Table 1  Hierarchical Design Structure of Data Identification Rule in the National “Data Networking” Root Service System

节点层级节点说明
顶级节点国家“数联网”根服务体系国家级节点
二级节点聚焦本体对象,如:人、企、车、物、地等
三级节点聚焦区域行业
四级节点聚焦组织机构
五级节点聚焦独立个体

新窗口打开| 下载CSV


此外,5个层级节点会逐级分配并下发标识规则,即除顶级节点外,每级节点均会继承由上级节点分配下发的固定标识串码和自定义标识长度,其中,自定义标识是指各级节点可以结合自身实际需求,建立对应本级级别的标识编码规则,从上级继承的固定标识串码连同制定完成的本级标识编码也将成为下一级节点的固定标识串码。同时,为了保证数据流通及关联融合的安全性,所有统一编码后的数据标识都将会利用泛化、抑制、置换、差分隐私等技术进行匿名化处理,从而增强对数据资源的隐私保护。匿名后的数据标识则可通过ID-Mapping等技术实现标识到标识、标识到数据的映射,从而解决不同编码体系难以兼容、数据资源难以互通的问题,实现多源异构数据资源关联融合。通过建立标识存储管理体系,实现数据标识的输入、输出、增加、删除、浏览、查询、修改、分类等[41]等功能,保证数据标识状态的实时更新。

3.3 跨区块链及跨隐私计算平台基础支撑体系

在流通环境层面,国家“数联网”根服务体系将采用跨区块链和跨隐私计算等技术手段,实现不同数据流通交易环境的互联互通。

(1) 跨区块链基础支撑体系

为解决异构链间信息流转难、数据流通受阻问题,国家“数联网”根服务体系中的跨区块链基础支撑体系架构设计思路如图3所示,其主要思路是利用跨链接口管理、多链协议互认等技术手段,通过跨链信息流通和真实有效证明,实现跨链协议互通、跨链交易一致、跨链信息可信可追溯等功能。

图3

图3   跨区块链基础支撑体系架构设计

Fig.3   Structure of Blockchain Interoperability Basic Support System


①跨链接口管理为跨链交互提供通用统一的接口,例如调度跨链资源的合约类接口、监听跨链请求的事件类接口、进行跨链交易验证的状态类接口等。

②多链协议互认中的协议主要包括分布式身份协议、证明转化协议、跨链寻址协议、跨链通讯协议[42]等,能够实现更高效的链间通信。

③跨链事务管理能够保持跨链事务的一致性和原子性,即跨链双方交易只能同时成功或者失败回滚[43],避免产生“双花”问题。

④跨链信任机制是指通过跨链的区块连续验证、区块共识验证[44]和交易验证,提高跨链双方的信任,促进跨链信任扩散和跨链信息安全流通。

⑤跨链交易验证的主要目的是准确核验交易的有效性,确认交易是否真实存在,同步更新交易的执行状态,避免出现交易中途撤销而数据资产已经转移等问题。

⑥跨链资产转移即对数据资产进行统一管理,通过设计合理的资产冻结和解锁条件,提高链间数据资产转移的安全性。

⑦跨链安全保障能够建立跨链“防火墙”,防止某一个或某几个链的崩溃影响到其他链的运行,防止恶意攻击影响整个区块链网络。此外,其建立的身份认证机制能够对接入的区块链进行可信度核验,提高跨链操作的安全性。

⑧跨链溯源存证能够对来自不同区块链的数据产品信息、数据服务内容、交易合同、系统关键日志等关键信息进行统一登记上链,并通过其自身的智能合约技术、时间戳技术和链式结构实现上链信息的永久存储、状态更新和不可篡改,实现信息的跨链可存证、可溯源。

(2) 跨隐私计算平台基础支撑体系

目前,各隐私计算平台使用的技术路径、认证体系、算子算法不一致,导致数据难以进行跨平台流通。为解决上述问题,国家“数联网”根服务体系中的跨隐私计算基础支撑体系架构设计如图4所示,其主要思路是通过“两跨四统一”,即跨平台协同计算、跨平台管理调度和统一标准、统一计算、统一调度、统一监管,实现跨隐私计算平台互联互通。

图4

图4   跨隐私计算基础支撑体系架构设计

Fig.4   Structure of Privacy Preserving Computing Platform Basic Support System


①跨平台协同计算包含统一标准和统一计算两个方面。一方面,统一标准是指通过制定统一的通信接口标准和通信协议标准,促进不同隐私计算平台间的实时通信。在此过程中,需要对接入的隐私计算平台进行身份认证,核验数据使用授权权限,加强对跨隐私计算平台数据流通的隐私保护能力。另一方面,统一计算是指为隐私计算平台提供统一的编译环境服务,从而规范算子和模型的编译过程,各隐私计算平台基于统一编译环境开发的算子和模型,经过标准化、校验和审核后,可以归并进入统一算子库和模型库。统一算子库和模型库包含加减乘除、比较统计等基础运算算子,数据对齐、数据清洗、数据拆分等特征工程算子以及机器学习、深度学习等模型算法。各隐私计算平台根据实际业务需求,能够共同维护统一算子库和模型库,以及可以对统一算子库和模型库进行直接调用和组合,从而形成标准化输出,促进跨平台协同计算。

②跨平台管理调度包含统一调度和统一监管两个方面。一方面,统一调度是指对任务的发起执行、任务状态同步、任务事件转发进行管理,保证计算任务的有序执行。此外,支持设置任务优先级,保障重要计算任务的优先执行。能够灵活分配计算资源,避免资源限制或者被多个任务同时竞争的情况,提高协同计算的稳定性和效率。对任务运行状态、资源使用状态、数据输入输出状态进行实时监控,若有异常会及时通报预警,进一步保障数据安全。另一方面,统一监管是指对跨平台计算中产生的各种日志进行全面收集、记录、分析、审计,对跨平台的接口调用情况、资源占用情况、数据访问使用等进行统一监管,提高跨隐私计算平台的安全性,实现跨平台资源调度的安全管控。

3.4 数据流通交易公共服务体系

数据流通交易公共服务体系是指重点为参与不同层级数据交易的主体提供统一、专业、公正、可信的综合服务,逐步提高市场主体参与数据交易的广度与深度。本文提出的几类公共服务主要包括统一数据登记备案、数据供需智能撮合、数据信用综合评估、数据合规审核认证、数据要素综合评估等。

(1) 统一数据登记备案服务

统一数据登记备案服务是指从规则统一、公开透明、服务高效、监督规范的目的出发,集中提供全国统一的交易账户注册管理、法人机构登记备案、数据目录登记备案、数据样本登记备案、数据资源代管和登记信息查询等服务。首先,信息由填表人通过互联网在线录入,登记系统保存录入信息,然后根据平台提供的多行业数据目录分类体系,通过智能化技术和目录管理流程,自动识别数据、整合业务知识,创建“全面、权威、智能”的数据资产目录,数据需求者可通过目录查询和使用所需的数据。此外,平台为每个交易账户赋予了唯一的“身份证号码”,即基于数据标识融合平台制定的统一标识码规则,实现对之后交易项目进行全生命周期的跟踪记录。在提供服务的同时,平台接收、保存和发布交易市场主体的行为信息,能够方便交易主体在参与不同层级(国家级、区域级)交易场所的活动时不重复登记注册,减少交易前准备事项。同时,支持国家级交易场所通过登记备案平台将其储备的可公开运营的数据资源为更多社会机构、企业法人等提供市场化服务。

(2) 数据供需智能撮合服务

针对当前数据交易供需对接不佳及规模不足等问题,国家“数联网”根服务体系从培育与引导市场的角度出发,在交易前置环节为交易主体提供数据供需数据试用与智能撮合服务,解决行业供需信息不对称的矛盾性问题,用技术、产品、服务重新定义智能撮合服务行业标准,为数据供需双方营造良性生态圈。重点基于交易主体的行为数据及人工智能算法针对用户需要的内容,提供需求搜集、样本数据动态管理、智能撮合推荐、模型执行效果评价、模型数据贡献度评估等服务。同时出于数据安全考虑,坚持撮合环境和生产计算环境相分离原则,提供“先体验再购买”的新型数据交易模式,在双盲数据沙箱场景下,通过需求精准推荐、匹配和撮合,实现对用户资源、平台资源、外部资源的有效整合,为用户提供一站式撮合服务。

(3) 数据信用综合评估服务

数据信用综合评估服务是指重点为数据交易主体、数据第三方服务机构提供信用评级、授信激励对象查询、数据交易失信惩戒对象查询、数据交易不良行为记录查询、数据交易信用修复等服务。通过整合法人基础情况、行政许可、行政处罚、守信激励名单、失信惩戒名单等多维度信息,利用多维数据交叉验证、机器学习、深度学习、专家评分等模型输出交易主体信用评级。同时,通过国家级信用平台和其他地方平台的互联互通实现不同层级信用评估互认。此外,引入第三方信用服务机构协同参与数据信用建设与监管,为第三方信用服务机构创造评估需求,发挥第三方信用服务机构对社会信用建设的推动与激励。

(4) 数据合规审核认证服务

数据合规审核认证服务是指为用户提供数据资源合规性审核、数据交易主体合规性审核、第三方服务机构合规性审核以及数据交易合同合规性审核等专业技术认证,能够提供溯源存证、模型审查、可信计算监控等具有安全性、完整性、证明力、时效性等的在线认证服务,重点为交易主体提供数据准入、法人准入、合同有效签署、原始数据未泄露、模型安全性证明等合规审核认证,充分保障用户合法权益,满足各方交易需求。

(5) 数据要素综合评估服务

数据要素综合评估服务是指基于多方联合建模和联邦学习中的激励机制算法,结合数据样本匹配度、数据质量、数据贡献度、数据信用度、数据后评价,数据管理成熟度、数据应用效果、数据成本等多重因素,建立动态的数据要素综合评估模型,从而实现主观与客观相结合的数据要素综合性评估,为交易产品、交易主体、交易行为提供多角度评估参考。

4 结语

本文梳理了近几年国内外促进数据流通交易相关技术研究现状,结合当前国内数据要素市场建设面临的共性问题,提出了“一核两翼N点”的国家“数联网”根服务体系总体架构,并进一步详细阐释了数据标识融合基础支撑体系、跨区块链基础支撑体系、跨隐私计算平台基础支撑体系和数据流通交易公共服务体系的设计思路。国家“数联网”根服务体系的提出能够为参与数据交易的各类市场主体提供安全可信流通环境和共性公共服务,进一步促进全国范围内跨地区、跨行业的数据要素流通交易平台互联互通和融合发展。下一步,拟围绕人、企、车、物、地等本体对象,继续探索完善统分结合的基础性数据要素标识管理规则体系,促进各方数据资源互联互通和高效使用,同时,进一步优化完善国家“数联网”根服务体系技术路径的完备性及可扩展性。

作者贡献声明

窦悦,易成岐:提出研究思路,设计研究方案,起草论文;

黄倩倩:提出研究思路,论文修订;

莫心瑶:文献调研,论文起草;

王建冬:论文选题,论文最终版本修订;

于施洋:提出研究思路,设计研究方案。

利益冲突声明

所有作者声明不存在利益冲突关系。

参考文献

李源, 高宁, 孙晶, .

基于区块链的大数据交易模式研究与探索

[J]. 大数据, 2021, 7(4):37-48.

[本文引用: 1]

( Li Yuan, Gao Ning, Sun Jing, et al.

Research and Exploration of Big Data Transaction Model Based on Blockchain

[J]. Big Data Research, 2021, 7(4):37-48.)

[本文引用: 1]

杨茂江.

基于密码和区块链技术的数据交易平台设计

[J]. 信息通信技术, 2016, 10(4):24-31.

[本文引用: 1]

( Yang Maojiang.

A Design of Data Trading Platform Based on Cryptology and Blockchain Technology

[J]. Information and Communication Technologies, 2016, 10(4):24-31.)

[本文引用: 1]

夏俊杰, 孙晔, 杨海涛, .

基于区块链的数据资产保护与交易平台研究及应用

[J]. 邮电设计技术, 2019(9):5-9.

[本文引用: 1]

( Xia Junjie, Sun Ye, Yang Haitao, et al.

Research and Application of Data Asset Protection and Trading Platform Based on Blockchain

[J]. Designing Techniques of Posts and Telecommunications, 2019(9):5-9.)

[本文引用: 1]

汪靖伟, 郑臻哲, 吴帆, .

基于区块链的数据市场

[J]. 大数据, 2020, 6(3):21-35.

[本文引用: 1]

( Wang Jingwei, Zheng Zhenzhe, Wu Fan, et al.

Blockchain Based Data Marketplace

[J]. Big Data Research, 2020, 6(3):21-35.)

[本文引用: 1]

王海龙, 田有亮, 尹鑫.

基于区块链的大数据确权方案

[J]. 计算机科学, 2018, 45(2):15-19,24.

[本文引用: 1]

( Wang Hailong, Tian Youliang, Yin Xin.

Blockchian-based Big Data Right Confirmation Scheme

[J]. Computer Science, 2018, 45(2):15-19, 24.)

[本文引用: 1]

张婷.

基于区块链技术的数字资产确权交易模型研究

[J]. 福建工程学院学报, 2019, 17(1):65-71.

[本文引用: 1]

( Zhang Ting.

A Study of Digital Assets' Copyright Confirmation and Transaction Based on Block Chain Technology

[J]. Journal of Fujian University of Technology, 2019, 17(1):65-71.)

[本文引用: 1]

王瑞锦, 唐榆程, 张巍琦, .

基于同态加密和区块链技术的车联网隐私保护方案

[J]. 网络与信息安全学报, 2020, 6(1):46-53.

[本文引用: 1]

( Wang Ruijin, Tang Yucheng, Zhang Weiqi, et al.

Privacy Protection Scheme for Internet of Vehicles Based on Homomorphic Encryption and Block Chain Technology

[J]. Chinese Journal of Network and Information Security, 2020, 6(1):46-53.)

[本文引用: 1]

何帅, 黄襄念, 陈晓亮.

区块链跨链技术发展及应用研究综述

[J]. 西华大学学报(自然科学版), 2021, 40(3):1-14.

[本文引用: 1]

( He Shuai, Huang Xiangnian, Chen Xiaoliang.

The Research Summary of the Development and Application of Blockchain Cross-chain Technology

[J]. Journal of Xihua University (Natural Science Edition), 2021, 40(3):1-14.)

[本文引用: 1]

Wang G.

SoK: Exploring Blockchains Interoperability

[J]. IACR Cryptol. ePrint Arch., 2021: 537.

[本文引用: 1]

Wood G. Polkadot:Vision for a Heterogeneous Multi-Chain Framework[EB/OL]. [2021-11-08].https://polkadot.network/PolkaDotPaper.pdf .

URL     [本文引用: 1]

叶少杰, 汪小益, 徐才巢, .

BitXHub: 基于侧链中继的异构区块链互操作平台

[J]. 计算机科学, 2020, 47(6):294-302.

[本文引用: 1]

( Ye Shaojie, Wang Xiaoyi, Xu Caichao, et al.

BitXHub: Side-relay Chian Based Heterogeneous Blockchain Interoperable Platform

[J]. Computer Science, 2020, 47(6):294-302.)

[本文引用: 1]

Kwon J, Buchman E. Cosmos Whitepaper[EB/OL]. [2021-11-08].https://cosmos.network/resources/whitepaper .

URL     [本文引用: 1]

Ethereum. BTC Relay Documentation[EB/OL].(2016-09-10) [2021-11-18].https://buildmedia.readthedocs.org/media/pdf/btc-relay/latest/btc-relay.pdf .

URL     [本文引用: 1]

WeCross. WeCross Blockchain[EB/OL].[2021-11-18]. https://wecross.readthedocs.io/zh_CN/latest/index.html .

URL     [本文引用: 1]

郭朝, 郭帅印, 张胜利, .

区块链跨链技术分析

[J]. 物联网学报, 2020, 4(2):35-48.

[本文引用: 1]

( Guo Zhao, Guo Shuaiyin, Zhang Shengli, et al.

Analysis of Cross-Chain Technology of Blockchain

[J]. Chinese Journal on Internet of Things, 2020, 4(2):35-48.)

[本文引用: 1]

李凤华, 李晖, 贾焰, .

隐私计算研究范畴及发展趋势

[J]. 通信学报, 2016, 37(4):1-11.

[本文引用: 1]

( Li Fenghua, Li Hui, Jia Yan, et al.

Privacy Computing:Concept, Connotation and Its Research Trend

[J]. Journal on Communications, 2016, 37(4):1-11.)

[本文引用: 1]

闫树, 吕艾临.

隐私计算发展综述

[J]. 信息通信技术与政策, 2021, 47(6):1-11.

[本文引用: 1]

( Yan Shu, Lyu Ailin .

Overview of the Development of Privacy Preserving Computing

[J]. Information and Communications Technology and Policy, 2021, 47(6):1-11.)

[本文引用: 1]

符芳诚, 侯忱, 程勇, .

隐私计算关键技术与创新

[J]. 信息通信技术与政策, 2021, 47(6):27-37.

[本文引用: 1]

( Fu Fangcheng, Hou Chen, Cheng Yong, et al.

Key Technology and Innovation of Privacy Preserving Computing

[J]. Information and Communications Technology and Policy, 2021, 47(6):27-37.)

[本文引用: 1]

Arachchige P C M, Bertok P, Khalil I, et al.

A Trustworthy Privacy Preserving Framework for Machine Learning in Industrial IoT Systems

[J]. IEEE Transactions on Industrial Informatics, 2020, 16(9):6092-6102.

DOI:10.1109/TII.9424      URL     [本文引用: 1]

Huang X, Ding Y, Jiang Z L, et al.

DP-FL: A Novel Differentially Private Federated Learning Framework for the Unbalanced Data

[J]. World Wide Web, 2020, 23(4):2529-2545.

DOI:10.1007/s11280-020-00780-4      URL     [本文引用: 1]

百度安全. MesaTEE 安全计算平台[EB/OL]. [2021-11-20].https://anquan.baidu.com/product/mesatee .

URL     [本文引用: 1]

( Baidu Secure Team. MesaTEE Secure Computing Platform[EB/OL]. [2021-11-20].https://anquan.baidu.com/product/mesatee .)

URL     [本文引用: 1]

华控清交. PrivPy多方安全计算平台[EB/OL]. [2021-11-20].https://www.tsingj.com/service .

URL     [本文引用: 1]

(HUA KONG TSING JIAO. PrivPy Multi-party Privacy Computing Platform[EB/OL].[2021-11-20]. https://www.tsingj.com/service .)

URL     [本文引用: 1]

京东云. 联邦模盒[EB/OL]. [2021-11-20].https://www.jdcloud.com/cn/products/union-learn .

URL     [本文引用: 1]

(JDCloud. JDCloud Federated Model Box[EB/OL].[2021-11-20]. https://www.jdcloud.com/cn/products/union-learn .)

URL     [本文引用: 1]

微众银行. FATE: 通用的联邦学习框架平台[EB/OL]. [2021-11-25].https://github.com/FederatedAI/FATE .

URL     [本文引用: 1]

(Webank's AI Department. FATE: Federated AI Technology Enabler[EB/OL]. [2021-11-25].https://github.com/FederatedAI/FATE .)

URL     [本文引用: 1]

蓝象智联. GAIA金融级隐私计算平台[EB/OL]. [2021-11-25].https://www.trustbe.cn/cpjs .

URL     [本文引用: 1]

(Trustbe. GAIA Financial Privacy Preserving Level Computing Platform[EB/OL].[2021-11-25].https://www.trustbe.cn/cpjs .)

URL     [本文引用: 1]

数牍科技. 安全高性能的隐私计算平台[EB/OL]. [2021-11-25].https://www.sudoprivacy.com/ .

URL     [本文引用: 1]

(Sudo. Safe and High Performance Privacy Preserving Computing Platform[EB/OL].[2021-11-25].https://www.sudoprivacy.com/ .)

URL     [本文引用: 1]

富数科技. FMPC安全计算产品[EB/OL]. [2021-11-25].https://www.fudata.cn/products .

URL     [本文引用: 1]

(Fudata. FMPC Secure Computation Platform[EB/OL].[2021-11-25].https://www.fudata.cn/products .)

URL     [本文引用: 1]

OpenMined Team. OpenMined[EB/OL].[2021-11-22]. https://www.openmined.org/ .

URL     [本文引用: 1]

Microsoft Team. Microsoft SEAL[EB/OL]. [2021-11-22].https://github.com/Microsoft/SEAL .

URL     [本文引用: 1]

Zhao C C, Saifuding D, Tian H L, et al.

On the Performance of Intel SGX

[C]// Proceedings of the 13th Web Information Systems and Applications Conference(WISA), Porto, Portugal. 2016.

[本文引用: 1]

徐潜, 章庆, 喻博, .

基于中间件与区块链的异构隐私计算平台互通系统研究

[J]. 信息通信技术与政策, 2021, 47(6):38-49.

[本文引用: 1]

( Xu Qian, Zhang Qing, Yu Bo, et al.

Middleware and Blockchain Based Interconnecting System of Heterogeneous Privacy Preserving Computing Platforms

[J]. Information and Communications Technology and Policy, 2021, 47(6):38-49.)

[本文引用: 1]

徐葳, 王云河, 靳晨, .

基于隐私计算的数据流通平台互联互通思考

[J]. 金融电子化, 2021(9):72-73.

[本文引用: 1]

( Xu Wei, Wang Yunhe, Jin Chen, et al.

Thoughts on Interconnection of Data Circulation Platform Based on Privacy Computing

[J]. Financial Computerizing, 2021(9):72-73.)

[本文引用: 1]

马静.

大数据匿名化隐私保护技术综述

[J]. 无线互联科技, 2019, 16(2):137-143,146.

[本文引用: 1]

( Ma Jing.

Survey of Big Data Anonymization Privacy Protection Technology

[J]. Wireless Internet Technology, 2019, 16(2):137-143, 146.)

[本文引用: 1]

张贝贝.

xID: 保护数据流通的隐形卫士

[J]. 软件和集成电路, 2019(2/3):50-53.

[本文引用: 1]

( Zhang Beibei.

xID: Invisible Guards to Protect Data Flow

[J]. Software and Integrated Circuit, 2019(2/3):50-53.)

[本文引用: 1]

谢家贵, 齐超, 朱佳佳.

工业互联网标识解析体系架构及部署进展

[J]. 信息通信技术与政策, 2020(10):10-17.

[本文引用: 1]

( Xie Jiagui, Qi Chao, Zhu Jiajia.

Architecture and Deployment Progress of Identifier Resolution System for Industrial Internet

[J]. Information and Communications Technology and Policy, 2020(10):10-17.)

[本文引用: 1]

Jung M Y, Kim W S, Chung S H, et al.

A Blockchain-based ID/IP Mapping and User-friendly Fog Computing for Hyper-connected IoT Architecture

[J]. IJICTDC, 2017, 2(2):12-19.

[本文引用: 1]

Ghosh A, Mahdian M, McAfee R P, et al.

To Match or Not to Match: Economics of Cookie Matching in Online Advertising

[J]. ACM Transactions on Economics and Computation(TEAC), 2015, 3(2):1-18.

[本文引用: 1]

Efthymiou V, Stefanidis K, Christophides V.

Minoan ER: Progressive Entity Resolution in the Web of Data

[C]// Proceedings of the 19th International Conference on Extending Database Technology (EDBT), Bordeaux, France. 2016.

[本文引用: 1]

沈志宏, 赵子豪, 王海波.

以图为中心的新型大数据技术栈研究

[J]. 数据分析与知识发现, 2020, 4(7):50-65.

[本文引用: 1]

( Shen Zhihong, Zhao Zihao, Wang Haibo.

Big Data Technology Stack Shifting: From SQL Centric to Graph Centric

[J]. Data Analysis and Knowledge Discovery, 2020, 4(7):50-65.)

[本文引用: 1]

项连城, 桑基韬, 徐常胜.

跨社交媒体网络大数据下的用户建模

[J]. 大数据, 2016, 2(5):32-42.

[本文引用: 1]

( Xiang Liancheng, Sang Jitao, Xu Changsheng.

Cross-OSN User Modeling in Big Data

[J]. Big Data Research, 2016, 2(5):32-42.)

[本文引用: 1]

池程, 柴森春, 谢滨.

工业互联网标识数据管理及应用技术研究

[J]. 信息通信技术与政策, 2019, 45(8):47-51.

[本文引用: 1]

( Chi Cheng, Chai Senchun, Xie Bin.

Research on Management and Application Technology for Industrial Internet Identification Data

[J]. Information and Communications Technology and Policy, 2019, 45(8):47-51.)

[本文引用: 1]

Belchior R, Vasconcelos A, Guerreiro S, et al.

A Survey on Blockchain Interoperability: Past, Present, and Future Trends

[J]. ACM Computing Surveys(CSUR), 2021, 54(8):1-41.

[本文引用: 1]

康博涵, 章宁, 朱建明.

基于区块链的智能服务交易跨链服务框架与通信机制

[J]. 网络与信息安全学报, 2021, 7(3):105-114.

[本文引用: 1]

( Kang Bohan, Zhang Ning, Zhu Jianming.

Research on Inter-Blockchain Service Framework and Communication Mechanism Based on Smart Service Transaction

[J]. Chinese Journal of Network and Information Security, 2021, 7(3):105-114.)

[本文引用: 1]

闵新平, 李庆忠, 孔兰菊, .

许可链多中心动态共识机制

[J]. 计算机学报, 2018, 41(5):1005-1020.

[本文引用: 1]

( Min Xinping, Li Qingzhong, Kong Lanju, et al.

Permissioned Blockchain Dynamic Cosensus Mechanism Based Multi-Centers

[J]. Chinese Journal of Computers, 2018, 41(5):1005-1020.)

[本文引用: 1]

/