一个我们不曾预料的虚拟世界正在悄然生长 | 云图思潮

数据是新时代的石油矿产。和石油能源一样,只有找到它、挖出来、加工好、运出去才有可能发挥其应有价值。近些年,随着数据呈指数级增长和被运用,关于数据的确权和定价、流动与共享等问题逐渐凸显,成为全数字化世界亟待解决的难题。

针对这些问题, PlatON创始人孙立林先生接受「造就」邀请,发表《重构数据的边界 数据管道工程师和梦想家》的主题演讲,不仅提出“数据的三权分立”观点,解读数据的治理和生命流程,而且对”超级清算方“的未来构想和实现路径进行了深刻剖析。

以下是全部演讲内容:

大家上午好,我是孙立林。可能大家觉得很奇怪,什么叫重构数据的边界?

一、悄然生长的另一个世界

我想先从几个故事开始。

在我的从业生涯里,我发现,我们熟悉的各个行业里产生的每一个颠覆性变革,往往来自于边缘市场,边缘人,边缘社区,边缘群落。这件事情非常有趣。

图片1

第一个故事,这个邮票上的人叫A.P.Giannini,他是今天著名的美洲银行的创始人。

在很早期的时候,美洲银行只是北加州的一家小银行。1907年,美国发生了金融危机,引发了旧金山大恐慌。在这次危机里面,几乎所有的银行都遭到储户的挤对。

A.P.Giannini做了一件非常聪明的事儿,在柜台后面放上大量的金子,让所有的用户一看,心里立刻放松下来。这件事情给我们的启发是信任的力量。

图片2

第二个人叫Dee Hock 。他是VISA的创始人,也是第一任总裁。当时情况非常混乱,大概有几十、上百家发行信用卡的银行或者金融机构在互相吵架,无法达成一致。

DEE Hock当时只是西雅图一家小银行的普通部门经理,但是在整件事情的组织当中,他展现了前所未有的勇气、决心和睿智。

在他的领导下,VISA正式成立,并且提出了新的交换体系,我们把它叫做“价值交换”模型。现如今中国银联、万事达等大家熟知的这些四方模式,其基本交换体制都是由VISA直接开创的。

图片3

第三个是支付宝。在2005年的时候,它第一次提出“你敢付,我敢赔”。用担保模式来重构整个中心化的信任机制,在这件事情上面,它做得很成功,现在已经成为主流的交易手段,我相信今天大家在座的各位,都用它扫码支付,还有打车等等。

所以回头看,金融业的整个体制的变化,都是从小机构一个一个来,逐渐解决我们日常消费中遇到的支付问题,让普通用户获得便利,让他们觉得生活已经很美好。

但是,事实并没有看起来那么美好。在整个金融服务行业里,对账和差错,对我们来说是每天都在发生的。

图片4

大概前年年底,PwC(普华永道)出过一个报告,全球场外交易市场,每年因为清算差错而导致的损失接近三百亿美元,这还只是给卖方造成的损失,还不算买方。我们也曾经经历过,因为差错造成了手工处理,要在几天的时间里面,调集几十上百同事,把账逐笔核对清楚。

所以问题出现了,表面上我们的生活越来越美好,支付越来越方便,金融服务越来越普惠,可是我们作为金融从业者,却看到了后台交易仍然存在的漏洞和弊端。

图片5

直到2008年中本聪发表那篇著名的论文,以及后来2013年、2014年以太坊的白皮书、黄皮书出来,我们才知道,还有另外一个我们不曾预料的世界,已经在悄然生长。

2012年第一次看见那篇论文的时候,我感受到了巨大的震撼。它给我最大的启发是, 原来我们真的可以从第一性上,第一次真正解决对账问题,让这个事情没有差错。

所以我们在这里提出一个问题: 是否会出现一个超级清算方?

图片6

超级清算方意味着什么?超级清算方应该把所有的工作,在后台完全处理掉,让前端的人没有感知,让数据交换和报文转发,进行得更容易。但这件事情并不容易。

在此基础上的第二个问题:作为金融基础设施的超级清算方,是不是可以跨行业,超越金融行业的视角,进军到医疗、物流、交通、航空、航天所有的领域?有没有可能成为一个超级账本?

图片7

更进一步来说, 在全数字化世界的公共基础设施里面,有没有可能出现一个真正意义上的运营商,由它来为跨行业、跨应用,为多中心提供完备的运营服务?

所以经过深度思考,重新抽象以后,我们提出一个核心理念,叫“ 为了数据的流动 ”。

二、重构数据的边界

但是在这里会遇到很多问题,首先是数据处于割裂状态,我们打个比方,盲人摸象。

什么意思?大象就像是这个世界的真相,在全数字化世界里面,这个大象就是数据的全面集合。 我们每个人都是盲人,有的人摸到了数据的鼻子,有的人摸到数据的腿,有的人摸到了数据的背。

图片8

作为个体,无论是个人,还是公司,还是政府机构,永远只能拿到数据的局面、侧面,几乎没有人可以拿到全部。

在这个基础上,数据各自为政,形成了诸侯分裂割据的局面,每个人都敝帚自珍,不愿意分享,或者无法分享(基于成本考虑、风险考虑或政策考虑),这就导致了数据无法流动。

1 数据的三权分立

那么在真正的数字化世界里,是否能有一个运营商来整合所有的数据,提供完备的数据交换?我们认为这应该是一个核心的挑战和命题。

基于这样的命题,我们提出了一个猜想,借用了一个概念,把它叫做: 数据的三权分立 。包括 数据所有权 ,以及相对应的 使用权 ,另外,又引入一个新概念叫 执行权

图片9

随着物联网的普及,我们相信在可见的15到20年里面,每个人无论走到哪里都将会被传感器包围。全世界会有一万亿个单位,成为智能节点,加入到网络成为计算节点,因此每一个节点都会有相应的需求。

图片10

每一个节点都需要参与到运算,都需要存储,都需要获取对方的数据,同时也生产自己的数据。这种情况下,主权关系,或者产权关系,应该怎么划分和切割?

这是从我们做清算的人来看,非常重要的基本问题。如果这个世界只有所有方和使用方,这两方永远是对立关系,因为大家都会算帐。大家会关注隐私权的边界到底在哪里?谁来为隐私提供可靠的保护?所以我们才引入了数据的执行方。

图片11

今天我们就像正处在数字化世界的蛮荒年代,我们都是不同的数字原始部落,就像当年一样,原始人这个村落产盐,那个村落有野兽,大家怎么交换,如何对数据形成定价,这个问题今天还无法解决。

这个执行方可以在割裂的双方之间,做一个分布式的虚拟容器,承载所有对隐私和数据的定价以及交换流动性的需求,这是我们对这个事情的理解,把它叫做数据的治理。

2 数据的治理

这是一个关键概念。什么叫做“治理”?它分为三个层面:

图片12

第一, 技术层面 。大家经常听到的区块链、分布式、云计算、大数据,都是在技术层面解决这个问题,无论是物理资源、还是逻辑资源;

第二, 业务流程的重构 。也就是说,一旦我们全部跨入到全数字疆界以后,从数据的录入,到数据交换生成,都需要整个业务流程重新思考和建构,这件事情给传统的组织带来很大的压力;

第三, 监管与合规性 。在法律上是不是对它有所保护和重新的界定?

今天的立法还不够完备,但是这三件事情才能构成完备的治理。数据的治理会涉及两个模式,一个叫做可信的数据交换,一个叫可信的协同计算。

图片13

什么是“可信”?

这个词可能听起来好像很好理解,但是其实还有很深刻的含义:

第一,真正意义上的“可信”需要在公网上进行。 目前我们所有的在线支付,实际的交割都是在专网里面,它不可能在真正的互联网上做交割,而今天这件事情在数字货币世界里边做到了,这是它的伟大之处。

第二,我们需要能够提供恰当的、灵活的、可装配的隐私保护。 这是今年《经济学人》里的一句话:“数据就是下一个时代最重要的资产,而更频繁的数据交换,将威胁隐私的保护。”

第三 ,需要在全网实时达成灵活的数据一致性。 也就是刚才提到的对账,每个参与方都需要对数据保持高度的一致,这个世界才能够运转。这里其实是四方,大家可以看一下,有数据所有方,执行方,使用方,逻辑提供方。

图片14

为什么又多了一方?

逻辑提供方意味着提供算法和算力的人。我们遇到过很多的需求,有一个是做量化投资平台,他告诉我说所有量化交易的算法是不可以披露的,但是他仍然需要跟数据拥有方一起,算一个结果,大家共同获益。这个情况下,传统的分布式架构,即便是今天,大家津津乐道的区块链技术,也不能完全做到这件事情。

我们需要引入新的算法,才有可能完备地从理论上、工程上解决这个问题,让数据不仅可以可信地进行交换,交割所有权,而且也可以在不交割所有权的前提下,大家一起计算,一起共享,这是数据治理的基本架构。

3 数据的生命流程

我们说数据是新时代的石油矿产,那么它的生命流程是怎样的呢?

图片15

第一环节当然是采集和生产。今天对应的是大量的传感器,部署在你几乎想像不到的地方,数量之多令人发指。

第二个是数据的存储和计算。这个不用说,云计算的概念,大家都接受了。

第三个是我们今天重点分享的,叫做数据分发和交换。 我们认为以分布式账本为代表的新技术,就是下一代互联网重要的核心基础设施,它主要的定位点就是下一个时代数据交换的协议站(或者叫协议层)。

图片16

它有点类似于可信数据的快递。大家天天收发快递,但是快递公司看不到这个包里到底装了什么,只能根据收发地址和交易价格来做撮合。大家可以把它理解成为类似于刚才说的三权分立里面的数据的执行方。

但是在全数字化世界里面,我们要考虑得更多,执行方是不是可以截取数据,篡改数据,甚至偷走数据?最好的情况是在所有的执行方看不到数据的情况下,仍然能对数据进行操作,这就是我们构想的下一代核心数据基础设施。

4 数据基础设施的基本架构

大家听了很多概念,去中心,无中心,还有强中心,我们怎么理解这件事情?

图片17

大家看左边的这张图,它看起来是不是有点像公司的架构图,最上面是董事长,然后是总裁CEO,副总裁、部门经理,下面是普通员工。

人类几千年来,就是用这样的金字塔结构,来做完备的治理或统治。从最高一层节点,层层往下下放信任,每一级获得相应的信任以后,又获得相应的权力,因为他掌握了核心的数据,和数据的仲裁权或者交换权。

这个模式的好处是对于整个社会组织和治理来说,效率最高,相应的成本最低。在计算机科学上我们把它叫做寻址的效率最高,因为你不需要广播,只需要回溯到树桩结构的上一级节点,就可以了解整个分杈能不能给你达成完备的交换或者交易。

图片18

但是它同样面临缺陷。于是在新的数据化时代,以比特币为代表的新一代的思路(姑且把它叫做思路),是右边这张图,它类似于摊大饼,它的模型叫标准的对等网络节点的数据共享和交换。

因为这里没有一个强中心节点向下层层转发信任,所以它只能由对等节点一起来算一个结果。实际上右边这张图,它的效率并不高,因为它没有中心化的治理结构保证效率,需要耗用更多的能源,来达到刚才说的可信和共识。

但它的问题并不出在“去中心”,问题是在现有的治理结构下面,其实是“无中心”。例如,保险公司最想打开医院的数据,可是医院不会搭理它,因为医院有它的上级管理机构,它只服从它的指挥,而保险公司上面是保监会。

图片19

医院和保险公司这两者之间没有一个中央机构来仲裁数据交换的标准格式,没有人能来给数据定价。所以这是一个标准的传统拓扑结构下,同级节点无法直接做交换或通讯的问题。

它的第二个弊病是,当节点越来越多的时候,传统的树状结构的治理方式,可能会崩溃。因为它无法在这么高量的参与方式下面保持良好的运转。

所以如果想让数字化的基础设施能够完备地运转,有没有可能在这两种拓扑结构当中,做一次重构,做一次妥协?我相信这是未来真正有价值的解决方案。

三、创造一个超级清算方

我们已经把一般意义上的资金交换,资产交割抽象到数据的层面,前面也谈了很多对数字化世界的定义和架构,回到一开始说的问题:我们如何去创造和管理数据的流动性?

这里有三个需要解决的问题:

图片20

第一,数据的资产化。 如果是金融世界里的资产化,大家很了解怎么做,可是谁来为传感器采集出来的数据做估值、定价和评级?谁来为数据的定价和评级做担保,谁来信任这个数据的价格?这是核心问题。

第二,数据交换货币化。 假定解决数据估值定价评级问题,那么它需要做交换,在交换当中需要引入度量衡来承载整个流动。

学过力学的人,应该记得“流动性”对应一个词,叫“摩擦“,做过交易所的知道,证券交易必须有摩擦,就是必须有成本,你每次买卖都有佣金,它才是一个有效率的市场。那么在数据的交换里面,也应该引入相应的摩擦,为数据的每一次交易来平衡和定价。

但是这件事情的困难在于,我们处在不同的需求场景里面,还有不同的隐私保护策略,不同的共识机制要求,可是还没有一种统一的数据交换工具,或者说一种统一的货币。

所以我们认为所有的数据交换,都需要引入一个相应的结算方式,或者是度量方式,来度量它流动的有效性。

图片21

第三,引入新的流动性入口。 随着历史的前进,有些交易方式,有些通讯方式,有些交换方式会被淘汰掉。

上一个互联网年代,一个疯狂的年代,是流量为王,每一家融资的公司都在讲我在Alexa.com上的排名是前一百,还是前十,由此获得相应的估值。这个疯狂的流动性,造就了我们今天的互联网。

那么下一个全数字化的时空里面,究竟什么是新的流动性入口?我们给出的三个答案是: 重定义激励机制;重定义密码学;重定义分布式。

图片22

在这里我认为,最重要的是激励机制。 上一个时代,在谷歌出现之前,其实我们已经用过很多代搜索引擎,从雅虎开始,为什么谷歌取得了胜利?

早期每个网页之间还是有墙的,不一定愿意被你链接和检索,直到谷歌引入一个新的算法,可以对这个链接以及链接背后相对应的网页内容做刚才提到的数据的估值、定价和评级,于是各种互联网商业模式滚滚而来。

我们出现了CPC点击付费,CPS、CPM,我们第一次把广告商和内容提供方串到了一起,导致几乎所有人,还反而愿意按照谷歌的搜索引擎算法来做优化,来获取相应的经济收益。

这就是激励的首要性,它给出了一个激励方式,用最轻的方式和最少的成本来撬动了这个世界,让所有人都连入到互联网,让信息能够流动起来。

图片23

重定义密码学是什么意思? 密码学在这个时代前所未有地被重视,因为所有的数据交换,都需要基于相应的隐私保护策略。

这里要提到“隐私与收益的博弈平衡“,意思就是作为一个经济动物,当你认为收益足够大的时候,你会愿意让渡自己的隐私权,来获取相应的收益。所以定价变得特别重要,激励机制特别重要,技术反而可以为之让步和妥协。

在密码学这里,所有的隐私算法,它的强度是可以被定制的,因为如果所有的保护都足够强的话,这个交换流动性就无法真正推动起来。

图片24

什么叫重定义分布式? 我们认为区块链只是分布式账本技术的一种实现,而分布式账本也只是分布式技术的一个分支。在全新的数字化疆界里,分布式技术架构应该长成什么样,这点还有待探索。

回到一开始我们提出的问题:是否可以出现一个超级清算方,超级清算方意味着什么?我们提到了 运营商 这个概念。

直到不久前,国家才宣布通讯运营商取消网间结算和漫游收费,十几年来我们都在抱怨漫游费太贵,话费太贵,数据流量太贵,今天它的成本在一再地下降,包括水电煤,它们已经成为了普适性的服务,而且是我们生存重要的基础设施。

这些基础设施,都还停留在物理时代,当我们进入数字化时代以后,数据的交换,会成为下一个时代标准的基础设施。

而所有基础设施的根本属性或者原则,在于它一定要能够推动所有的交易成本趋近于0。

图片25

我们的理想,就在于让它无论是银行卡,还是证券、债券、票据、信用衍生品,还是能源、医疗数据、航空航天数据……所有的数据,交换的成本都逐步趋近于0。大家生活在这样的世界里面,才能享受到数字化世界真正的好处和收益。

而我们做的工作,我们这些数据管道工程师,就将沉降成为基础设施,就跟今天大家看见的,中国移动、中国电信是一样的。

十几年前有一个段子,站在风雨中手拿小灵通,左手换右手,永远打不通。那个年代因为基础设施不完备,我们想把一段话音数据,通过IP转发,路由器转发,非常困难。基站、终端,所有的地方都有问题,协议都不完备,可今天这个问题几乎不在存在。

我们也相信,虽然今天的数据流动性受到了巨大的阻碍,我们还无法清晰地定义数据的产权,定义数据的所有权和数据隐私保护的强度。

但是随着技术的发展,随着节点数日益增多,随着能够参与计算的人或节点越来越多,投票权的日益分散,这件事情的到来会变得更加快速,会超乎我们每个人的想像。

四、 留给未来的问题

尽管还有一些问题,是我们想不到的,或者还没有做到的。

图片26

比如: 全数字化世界的度量衡是什么?

刚才我们说这个度量衡可以被叫做货币,那么,会是统一的货币吗,会是由国家发行的法定的货币吗?我们还无法想像。

系统真的可以去中心化吗?

从算法来说,算法是可以不依赖于中心的,但是系统可以吗?如果我宣称做了一个安全的算法,可是其他人怎么能够相信我这个算法是安全的,怎么能够相信我会秉持道德的基本原则,不做坏事?

在完全无中心,或者去中心的环境下面,这件事情可以发生吗?我认为乐高式的简单实现有可能,但是复杂网络有难度,我们还没有想清楚。

算法需要有道德吗?

我们把它叫做算法和数据的伦理学。人需要有道德,人需要有信用,算法需要有道德吗?算法可以被无限制地使用吗?数据的隐私有边界吗?这个数据到底属于我,还是属于你?

在这些问题没有得到恰当的治理和解决之前,所有的技术,都只是一次近似的模拟和探索而已。

图片27

全数字化世界也不见得就是人类的终点,它只是一条依稀可见的路径。

我们今天提出了这些命题,我们给自己一个激励,说伟大的人类不是去解决问题,而是提出问题,我们相信一定有后来人不断跟上,来解决这些问题,创造更美好的数字化的未来。

把这些问题留给未来,留给大家,谢谢!

微信图片_20200227211445
扫码获取PlatON更多详情,还有技术干货哦!

8 个赞