数据要素市场在整体架构上将是分布式的,但会有一些「数据中介机构」作为核心节点,区块链可作为数据要素市场的组织工具。
原文标题:《邹传伟:区块链在数据要素市场中的应用|万向区块链「融合创新」系列行研报告》撰文:邹传伟,万向区块链首席经济学家
本文为万向区块链「融合创新」系列行业研究文章,作者为万向区块链首席经济学家邹传伟博士。本文采取「化整为零」方法,先将数据价值链分为数据记录和获取,数据收集、验证和存储,数据分析,以及数据要素配置等4个环节,再依次讨论区块链在这些环节能发挥的作用。
区块链和数据要素市场是当前两个备受关注的领域。今年4月,中共中央和国务院《关于构建更加完善的要素市场化配置体制机制的意见》首次将数据列为要素之一,国家发改委在对「新基建」的界定中将区块链定位于新技术基础设施。很多专业和学者讨论了区块链在数据要素市场中的应用,高度肯定这方面应用对保护和使用个人数据以及为AI发展完善数据基础的重要意义。但与区块链在央行数字货币、稳定币、供应链金融、存证和防伪溯源等领域的应用不同,数据要素市场本身处于发展早期,在很多核心问题上尚无定论,这使得关于区块链在数据要素市场中的应用的讨论很难深入。
本文在之前研究的基础上,讨论区块链在数据价值链的不同环节能发挥的作用。根据全球移动通信系统协会2018年报告,数据价值链主要可分为4个环节:一是数据生成,指数据记录和获取。二是数据收集、验证和存储。三是数据分析,指处理和分析数据以产生新的洞见和知识。四是交换,指对数据分析结果的使用,既可以是内部用,也可以对外转让,这个环节称为「数据要素配置」更合适。本文共分5部分,前4部分依次按上述4个环节展开,重点是对第4个环节的讨论,第5部分总结全文。
图1:数据价值的主要环节
区块链在数据记录和获取中的应用
区块链是关于Token的分布式账本,Token本质上是区块链内定义的状态变量。区块链内既存在与Token及其交易有关的数据,也存在与Token及其交易无关的数据。
与Token及其交易有关的数据——区块链各地址内有多少Token以及不同地址之间的Token交易记录——原生于区块链并被区块链记录下来,是数学规则的产物,真实准确性由密码学、共识算法等保证。从占用区块链内存储空间的比例以及验证节点投入的计算资源来衡量,这部分数据在区块链内数据中居于主导地位,也是区块链内「价值含量」最高的数据。比如,在央行数字货币和稳定币等应用中,这部分数据是分析资金流动和实施反、反恐怖融资等监管的基础。再比如,在加密货币定价中,链内交易数据是重要的估值参考。
邹传伟:《Web3 经济与代币化未来》白皮书将于今日发布,一切价值皆可代币化:4月15日消息,2023 香港 Web3 嘉年华《代币化未来》主题论坛中万向区块链首席经济学家邹传伟发表Web3 新经济和代币化主旨演讲,其在演讲中宣布万向区块链将于今日发布《Web3 经济与代币化未来》白皮书,白皮书将从 Web3 底层逻辑和进化趋势切入,讨论一切价值皆可代币化的前景,探讨代币经济学涉及的货币政策和机制设计等问题。
邹传伟在演讲中表示,下一个 15 年 Web3 新经济中新的发展中心是 Web3 应用,且代币化范围会扩大,一切价值皆可代币化。代币化的 4 种主要方式包括:代币代表使用权、NFT 代表身份证明和能力证明等、代币代表链外价值、代币代表收益权。代币的真实价值有 5 个方面,包含代币发行、代币使用权、代币流通、代币股权属性、代币治理属性。[2023/4/15 14:05:45]
与Token及其交易无关的数据作为Token交易的附加被写入区块链内。写入区块链意味着全网可见,不可篡改,并且在复制、传播中不会出错,但区块链本身不能保证这些数据在源头和写入环节的真实准确性。因为区块链内存储容量的限制,这部分数据在很多时候只能以哈希摘要形式写入区块链,只有少量结构化信息才能以原始数据形式上链。因此,在现实世界无时无刻不在产生的瀚如烟海的数据中,能以原始数据形式上链的比例几乎可以忽略。这说明,区块链不是一个有一般用途的账本或数据库,应该用其所长,只有价值足够高的数据才值得以原始数据形式上链。
哈希摘要上链主要作用是存证,为存放在本地设备或云端上的原始数据增信——在事后通过揭示原始数据,证明两点:一是在区块链记录的上传时点,原始数据确实存在;二是上传者确实知道原始数据。但不宜拔高理解区块链的存证和为数据增信的作用。特别是,对并非原生于区块链的数据,其可信度离不开专门的数据记录和获取技术以及相关制度的支持,比如接下来将讨论的「区块链物联网」对物联网数据的管理。
物联网设备不断从周边获取地理位置、温湿度、速度和高度等数据。在目前的端侧抗攻击技术下,物联网数据在源头的真实准确性有相当程度的保障。物联网数据主要存放在云上和物联网设备本地。大部分物联网能够运行哈希算法和公私钥签名运算。在物联网数据上链中,只有少量结构化数据可以直接写入区块链,大部分数据是以哈希摘要的形式上链。因此,在「区块链物联网」对物联网数据的管理中,相关操作均由物联网设备自动执行,效率非常高,也减少了人为干预。
邹传伟:数字货币存在于互联网上,天然是跨境的:11月23日举行2020卓越竞争力金融峰会,万向区块链首席经济学家邹传伟出席会议并发言。关于现金的核心的特征,他表示有三点:第一,现金上不会记录谁持有过它,第二,现金是一个门槛很低的东西,任何人都可以去使用它,第三,现金是一个点对点交易,不需要第三方人在场做见证。我们希望通过数字货币能保有现金的这些特征,同时也希望能超越现金。因为现金用起来还是物理化的东西,数字货币存在于互联网上,使用会非常方便。而且像数字货币天然是跨境的,这点是目前现金、银行卡不具备的一个特征。[2020/11/23 21:47:08]
「区块链物联网」为理解区块链在数据记录和获取中的应用提供了基准。在物联网数据以外,很多数据在记录和获取中受人为因素影响很大,是否值得上链,需要算成本和收益的细账。
区块链在数据收集、验证和存储中的应用
数据收集、验证和存储主要靠数据库技术,区块链能直接发挥的作用有限。比如,金融领域对个人数据的管理,现在普遍强调API技术的应用,通过数据聚合产生复合价值。
如第一部分讨论的,区块链能存储的数据非常有限。绝大部分数据存放在本地设备或云端上,但可以通过哈希摘要上链来增信。另外,如果数据收集、验证和存储通过由不同机构组成的市场分工网络进行,那么理论上,这个市场分工网络可以构建在区块链上。分布式存储项目Filecoin可以视为这个方向的尝试。这个方向要取得大范围成功,需要做好分布式经济体的机制设计。我把相关的经济学问题概括为分布式数据经济体,将在第4部分讨论。
区块链在数据分析中的应用
区块链在数据分析中能直接发挥的作用也非常有限。因为区块链内计算性能的限制,复杂的数据分析工作一般不通过区块链内智能合约进行,而主要靠统计学、计量经济学、数据可视化、大数据分析和AI等技术,相关计算发生在区块链外。
如果数据分析也通过不同机构组成的市场分工网络进行,那么理论上,也可以引入基于区块链的分布式数据经济体。比如,PlatON项目致力于建设一个高性能的计算网络,以促进数据和算力的流通,主要的市场参与者包括计算协调方、数据提供方和算力提供方等。
区块链在数据要素配置中的应用
区块链作为一项带有生产关系色彩的集成型技术,在数据要素市场中的应用将主要体现在数据要素配置环节。接下来将从数据要素确权和数据要素市场的组织形式两个层次讨论这一问题。
邹传伟:区块链技术在数据产权界定中发挥重大作用:5月17日消息,万向区块链首席经济学家邹传伟发文《如何建立合规有效的数据要素市场》称,如何建立合规有效的数据要素市场,一个可行选项是使用密码学技术。区块链技术用于数据存证和使用授权,也在数据产权界定中发挥重大作用。(第一财经)[2020/5/17]
数据要素确权
经济学研究表明,任何资源有效配置的前提都是确定资源的产权,数据要素也不例外。产权是一个复杂的经济学概念,指一种可执行的社会架构,该架构决定资源如何被使用或拥有的。产权有三个核心维度:第一,使用资源的权利;第二,从资源中获得收益的权利;第三,将资源转移给他人,改变资源,放弃资源,以及损毁资源的权利。产权可以细分为所有权、占有权、支配权、使用权、收益权和处置权等「权利束」。
数据兼有商品和服务的特点,很多数据是非排他性的和非竞争性的,数据的所有权不管在法律上还是在实践中都是一个复杂问题,特别对个人数据。现实中,能清晰界定所有权的数据的典型代表是专利,但从专利更能看出数据确权的复杂性。
取得专利权的前提是公开发明的技术内容,以便大众作进一步改良,避免重复研发的资源浪费。比如,专利审理机关一般会在发明专利申请后约18个月将专利说明书内容公开。专利权人在法定期间内享有专利技术的排他权,享有商业上的特权利益。这是为保护发明人的权利,鼓励大众从事发明。当专利权法定期间届满时,专利权即告消灭,民众可根据专利说明书所揭露的内容,自由运用其专利技术。
从全球实践看,数据要素确权是法律和技术共同作用下的产物,一般先由法律确定数据产权的制度框架,再由技术来保证这些制度框架的可执行性。比如,现在很多报刊杂志是付费的,只有付费账户才能阅读文章,并通过技术来限制对文章的复制和截屏,如果发现有人抄袭就通过法律来维护权益。在很多场合,只靠技术是没法对数据要素确权。第一部分讨论了区块链的存证作用。数据存证不等于数据确权。比如,发明人可以把发明文件的哈希摘要放到区块链上,证明自己最早做出相关发明,将来出现纠纷时有「自证清白」功能。但如果不经过专利审查机关的核准,发明文件上链不意味着专利权。
一些专家和学者认为,只有所有权清晰的数据才能进入数据要素市场。这是很大的误解。「所有权清晰买断式交易」模式只适合像专利这样的特殊类型数据,但不会成为数据要素市场的主流。在实践中,数据要素市场成立的前提是对数据的有效控制,也就是控制谁能在何种条件下以何种方式使用数据。换言之,数据产权归根结底体现为对数据的有效控制。这个角度有助于理解区块链在数据要素确权中的作用。
万向区块链邹传伟:在DC/EP中区块链用于数字货币的确权登记 居于辅助地位:万向区块链首席经济学家邹传伟表示,支付系统(乃至金融基础设施)分为账户范式和Token范式,前者以银行账户体系为代表,后者以区块链为代表。邹传伟分析认为:DC/EP发行登记子系统由中央银行负责维护,是中心化的,不需要运行共识算法,这样就不会受制于区块链的性能瓶颈。在DC/EP中,区块链用于数字货币的确权登记,居于辅助地位,比如网上验钞功能。邹传伟也曾表示,DC/EP和现金的投放路径类似,二元体系设计考虑了商业银行利益,预计会进一步推动商业银行去拓展零售支付和零售业务。(中国经营网)[2020/4/26]
在区块链内,地址能隐藏实际控制者的身份,哈希摘要能隐藏原始数据,但区块链本身不是隐私管理技术。特别是,公链内数据是全网可见的,需要配合环签名、混币和合币等技术才能隐藏链内资金流向。联盟链可以实现对数据的有差异开放,让不同用户在读取区块链内数据上有不同权限。但正如第一部分讨论的,区块链内存储的数据毕竟有限,区块链在数据控制上的直接作用也是有限的。比如,「区块链政务数据共享」类项目中,政务数据存放在本地设备上,跨政府部门的数据调用仍通过传统方法进行,原始数据不可能在区块链上流通,但区块链会记录数据申请、授权、调用和访问等记录,做到不可抵赖,主要为事后审计留痕。
在各种数据控制技术中,与区块链关系最大的是密码学技术,包括可验证计算、同态加密和安全多方计算等。对复杂的计算任务,可验证计算会生成一个简短证明。只要验证这个简短证明,就能判断计算任务是否被准确执行,不需要重复执行计算任务。在同态加密和安全多方计算下,对外提供数据时,采取密文而非明文形式。这些密码学技术使得「数据可用不可见」,但因为对计算资源的要求很高,只能在区块链外进行。
在各种数据控制技术中,与区块链最容易混淆的是支付标记化,在此也做简单说明。支付标记化的英文是Tokenization,指用特定的支付标记替代银行卡号和非银行支付机构支付账户等支付要素,并对标记的应用范围加以限定,降低在商户和受理机构侧发生银行账户和支付账户信息泄露的风险,减少交易欺诈,保障用户交易安全。支付标记与银行账户、支付账户之间有映射关系,这个映射关系由标记服务提供方通过支付标记化和去标记化两个过程来管理。支付标记化是数字支付的基础核心要素。比如,在移动支付中,用户使用Token号作为存储在手机等移动设备中的设备卡号,可以在线下POS机、ATM机等终端机上用移动设备做非接触式近场支付,也可以在手机客户端中直接发起远程支付。
哈佛梅森学者邹传伟:保险会受区块链技术影响,但不会消失:今日,哈佛梅森学者邹传伟在“清华五道口@迭代区块链创业营”群中回答关于由于区块链技术的发展,保险业是否会消失时回答道:“保险不会消失。保险有两种形态:公司型保险(我国占主导的形态)和契约型保险(国外很多,我国近期发展的相互保险属于这个形态)。技术会影响保险公司的展业方式,特别在营销、定损和赔付等方面。但保险的功能不可能被技术替代,而且到目前也看不到技术会在保险的两种形态以外催生出其他形态。”[2018/3/4]
目前,银联手机闪付和在线支付产品已全面应用支付标记化技术。从以上介绍可以看出,支付标记化中的Token是代表银行账户和支付账户等敏感信息,有规范的编制标准,不依赖于复杂的密码学技术;区块链内的Token在央行数字货币和稳定币等应用中代表法定货币储备资产,但Token本身是区块链技术的产物。
数据要素市场的组织形式
数据要素因为类型和特征多样,缺乏客观的估值标准,并且在很多场合不会采取买断式交易模式,所以数据要素市场不会像股票市场那样,成为一个集中化、流动性好的交易市场。这从过去几年多省市对大数据交易中心或大数据交易所的试验中可以得到验证。这些试验都没有取得预期的成功。这尽管有政策支持力度不够和配套技术跟不上等原因,但更重要的原因则是:数据要素的经济学属性不支持标准化程度高、竞价撮合和成交活跃的交易模式。
在大图景上,数据要素市场将更接近债券市场和场外衍生品市场这样的场外市场,标准化程度较低,点对点交易并协商定价,成交频率低但会一直发生。但这不意味着最终的数据提供者和最终的数据需求者会直接进场交易。数据要素市场会演变出一些「数据中介机构」,让数据更好地从最终的提供者流向最终的需求者。
因此,数据要素市场在整体架构上将是分布式的,但会有一些「数据中介机构」作为核心节点。对区块链在数据要素市场组织形式这个环节的应用,要在这个大框架分析。
第一,「数据中介机构」的主要功能是数据收集、验证、存储和分析。对这些「数据中介机构」如何使用区块链,第二、三部分已有分析。需要补充说明的是,区块链可以用来改进数据发布环节。比如,姚前2018年在央行数字货币原型系统中,提出将区块链应用于央行数字货币确权登记。他的设想是,由中央银行和商业银行构建央行数字货币分布式确权账本,提供可供外部通过互联网进行确权查询的网站,实现央行数字货币的网上验钞机功能。这是利用区块链不可篡改、不可伪造的特性提高确权查询的数据和系统安全性。
第二,如前面已讨论的,现实世界中大部分数据不会通过区块链存储和流转,但区块链可以记录数据的授权、调用和访问等活动,这类似于区块链在供应链管理和商品溯源等场景的应用。这个应用方向有价值,但创新意义不是很强。首先,数据分析和使用会产生新数据,使得对数据流通的溯源意义不大。其次,如果要从数据保密和防泄漏的角度跟踪追溯数据流通,分析TCP/IP数据包是比区块链更直接、有效的方法。
第三,区块链作为数据要素市场的组织工具,这就是前面引入的分布式数据经济体概念:
分布式数据经济体的基础是数据确权,体现为数据提供者能有效控制数据需求者对数据的使用。分布式数据经济体是一个丰富的数据生态。不同参与者在数据、算法和算力等方面互通有无。这本质上是通过市场机制进行大规模协同计算,在保护数据产权的情况下实现数据要素的有效配置,以促进经济发展和增进社会福利。区块链记录下分布式数据经济体中的经济活动,但不是为了存证和溯源,而是为了对经济活动进行核算。在分布式数据经济体中,交易媒介采用央行数字货币或稳定币。原因在于,分布式数据经济体的一些参与者可以是非人格化的,比如物联网设备作为数据提供者,AI算法作为数据需求者。央行数字货币和稳定币能兼容分布式数据经济体的这种开放性,并且能保障支付的安全和高效。分布式数据经济体有很多有意思的应用场景。比如,在「区块链物联网」中,物联网设备ID绑定数字货币钱包地址,物联网中的数据存储、传输和挖掘以及价值交互就能以可信方式进行,物联网中与数据有关的经济活动通过央行数字货币或稳定币来核算。可以设想,当一个物联网设备持续提供高质量数据后,将收获更多央行数字货币或稳定币作为「酬劳」。这种经济激励将显著促进物联网数据的收集和使用。
这个方向有助于实现肖风博士提出的分布式认知工业互联网。分布式认知工业互联网采取分布式的治理架构,所有企业都可以放心加入,采取基于知识图谱的认知智能技术以及基于隐私计算的数据协同,并且基于全生命周期管理的制造和服务的融合。
小结
区块链对建设数据要素市场有重要意义。但因为数据要素市场本身处于发展早期,在很多核心问题上尚无定论,这使得关于区块链在数据要素市场中的应用的讨论很难深入。本文采取「化整为零」方法,讨论区块链在数据价值链的不同环节能发挥的作用。
第一,数据记录和获取环节。区块链作为关于Token的分布式账本,不能当作一个有一般用途的数据库来用。与Token及其交易有关的数据,原生于区块链并被区块链记录下来,是区块链内「价值含量」最高的数据。但在现实世界的海量数据中,能以原始数据形式上链的比例几乎可以忽略,大部分数据只能以哈希摘要形式写入区块链。哈希摘要上链有存证和为原始数据增信的作用。「区块链物联网」对物联网数据的管理,效率高且人为干预少,为理解区块链在数据记录和获取环节的应用提供了基准。其他数据是否值得上链,则要仔细平衡成本和收益。
第二,数据收集、验证、存储和分析环节。区块链在这些环节能直接发挥的作用有限。但如果这些环节通过由不同机构组成的市场分工网络进行,那么就可以构建在区块链上,成为分布式数据经济体。
第三,数据确权环节。数据确权是数据要素配置的基础。数据要素确权是法律和技术共同作用下的产物。通过区块链为数据存证不等于数据确权。在实践中,数据确权主要体现为数据提供者能有效控制数据需求者对数据的使用。在这个意义上,区块链不是隐私管理技术。联盟链可以做到对数据的有差异开放,让不同用户在读取区块链内数据上有不同权限。但区块链内存储的数据有限,区块链在数据控制上的直接作用也有限。可验证计算、同态加密和安全多方计算等密码学技术使得「数据可用不可见」,但因为对计算资源的要求很高,只能在区块链外进行。
第四,数据要素的配置环节。数据要素市场在整体架构上将是分布式的,但会有一些「数据中介机构」作为核心节点。区块链不可篡改、不可伪造的特性有助于改进数据发布环节。区块链可以记录数据的授权、调用和访问等活动,有一定价值,但创新意义有限。区块链在这个环节的创新价值主要体现为分布式数据经济体,本质上是通过市场机制进行大规模协同计算,在保护数据产权的情况下实现数据要素的有效配置。分布式数据经济体有助于实现分布式认知工业互联网。
附注:
GSMA,2018,"TheDataValueChain".
哈希摘要的另一个主要用途是与原像配合,在哈希时间锁合约和离散日志合约中作为多方协调工具。可参考《哈希时间锁应用》,https://www.chainnews.com/articles/365768981629.htm。
对Filecoin经济学模型的分析可见《Filecoin经济模型简述》,https://www.chainnews.com/articles/974219932958.htm
感兴趣的读者可以参考PlatON的经济学蓝皮书:https://platon.network/pdf/zh/PlatON_Blue_Paper_on_Economics_ZH.pdf
Tokenization与加密有一定联系,但也有很大区别,请见:https://www.mcafee.com/enterprise/en-hk/security-awareness/cloud/tokenization-vs-encryption.html
姚前,2018,《中央银行数字货币原型系统实验研究》,《软件学报》2018年9月,总第29卷第9期。
https://www.chainnews.com/articles/636789905948.htm
本文来源于非小号媒体平台:
邹传伟
现已在非小号资讯平台发布27篇作品,
非小号开放平台欢迎币圈作者入驻
入驻指南:
/apply_guide/
本文网址:
/news/9558352.html
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表非小号的观点或立场
上一篇:
币安为何推出第三条链?这对BNB意味着什么?
标签:区块链TOKENFIL数字货币wpc币区块链Covid TokenFIL币再次爆发的时间数字货币交易所app下载安装
我受团队的委托,代表优证链通发布Unizon去中心化时间锁管理框架1.0版本。图1.UnizonTimelockAdmin主界面这个公号主要是介绍自己学习区块链的一些感悟,Timelock这么专.
本公众号由币比网(bibiwang.com)战略支持,文章在币比网和我的公众号同步发布。本文不构成任何投资建议,投资有风险,入市需谨慎!上文说到以太坊帝国正逐渐没落,BTC也不能独善其身,那么谁.
本周技术周刊包含以太坊、波卡、COSMOS、Filecoin网络的技术类新闻。 以太坊网络 以太坊2.0存款合约地址余额突破10亿美元金色财经报道,Etherscan数据显示,截至12月18日凌.
这篇文章是ChrisBurniske继《加密资产估值》之后对于数字货币估值的另一篇心得。本文的讨论对象是比特币和以太坊这样的基础公链.
Gate.ioACH净买入大赛即时开战,60个获奖席位,1,000,000ACH总奖池,最高$1300美元单人奖等你来赢!活动时间:北京时间2020年12月21日12:00-12月28日12:0.
10月8日至11日,以太坊基金会主办的第五届以太坊开发者大会在日本大阪举行,总共有183位主题演讲者、57位闪电演讲者在为期四天的312场演讲和讨论中登场分享.