2021年3月29日19:30,PlatON Cross 联合发起人Jason受邀来到Gate的直播间,以“AI的B面:数据隐私与主权”为主题,与主持人立春共同探讨行业技术与发展。
在正式交流前,Jason简单介绍了一下PlatON Cross:“PlatON Cross大家可能不是特别的熟悉,因为也是一个全新的平台。我们是致力于推动PlatON生态建设的一个社区平台,主要是在社区打造文化交流技术分享,以及节点建设的相关方面,为了推动隐私计算和数据革命一个新理念,新技术,新应用的生根发芽和茁壮成长,希望跟大家一起共同来见证这个历史的新起点。”
在直播过程中Jason与主持人以问答的互动,就主题相关内容进行探讨,向Gata直播间的用户分享了自己对于AI隐私数据、PlatON未来发展的一些看法。
以下内容根据录音文件整理,具体行文与原话在表达方式上有一定的精简和调整。
▌ PlatON是面向数据资产分布的分布式隐私AI平台,具体可以解决现实哪些问题,现实中的实际问题哪些地方是可以解决的?
PlatON作为一个平台,最重要的功能是去匹配供需的双方,就像淘宝是一个商城平台,他不会去卖衣服,但是他需要让卖家买家,都能够更好的来使用这个平台,所以说平台最重要的不是去解决一些五花八门的应用,最需要的是解决供需双方的基础的共性问题,能够更好地服务双方。
回到刚才的定义,即分布式隐私AI平台,从这个范畴来说,PlatON真正解决基础的共性问题,我认为是以下几个方面:
1.解决数据确权的问题
数据主权的保护是很被重视的一个问题,比如欧盟出台的通用数据保护条例。同样在我们中国,也出台了数据安全法,虽然还是草案,还在征求意见阶段,不过也能看出国家各方面都非常重视主权数据主权的保护。
但是法律,它虽然能界定主权,也就是数据属于谁,却没办法很好地保护数据主权,很多时候只能用于事后的追诉。数据资产和实物资产不一样,它可以无限地被复制和传播,一旦被人看到,就有可能被拿走,并且任意的传播。
而PlatON用密码学的方式来解决了这个问题。我的数据,其他人可以用,但是你看不见,或者你即使能看见也看不穿,因为外面封了一层。这个方式解决了数据主权的问题,让大家的数据主权可以被技术所保护,而不是仅仅的被法律所界定。
2.解决数据交易的问题
数据是有价值的,也是可以被交易的。事实上,在我们国家的很多地方,比如最有名的在贵阳有专门的大数据交易所,但是使用者寥寥无几,没什么业务。但这个并不能说明数据交易是没有意义的,实际恰恰相反,在我们很多看不到的地方有很多数据交易是如火如荼的在进行,可是都是违法的。比如我们的个人数据,大家都有接到骚扰电话的经历,那就是我们的个人数据在被违法的倒卖,这个数据交易是在真正进行的。
所以为什么数据交易有意义,但是没有发展起来,主要原因在于主权并没有得到保护。我的个人信息被倒卖,我是数据的所有者,我有数据的主权,但是受益者不是我,是倒卖我信息的人,所以数据主权的问题如果不能被解决,那么数据交易就很难实现。而PlatON在数据主权确权保护的问题这个基础上,建立了数据和算力的交易平台,让数据交易是可以真正进行的,解决了数据交易的问题。
3.解决了AI数据源的问题
人工智能的本质就是让机器可以像人一样去思考和行动,人要变得更智慧,必须得不断的学习,俗话说,活到老、学到老,其实机器也是一样的。机器的智能能够达到什么程度取决于他学习的知识的多少,这个知识就是数据。
当下获取数据的方式有两种:一是靠垄断,二是违法数据倒卖。如果不是没有办法,谁都不愿意真正将自己的数据拿出来共享,所以一旦解决了数据的主权以及交易的问题,未来数据的所有权不但能够受到保护,同时我们作为数据的所有者,还可以通过交易数据的使用权来获得报酬,这是一个双赢的局面。我通过出售我的数据得到报酬,而你用我的数据来提升AI智能,这样可以让AI学习的数据更全面,更丰富,AI的发展会更快更迅速。
▌ PlatON和云图这两个名字很有深意,其中也包含了不少哲学的意味,能给我们讲解一下这个两个名字的由来吗?
这两个名字确实是充满了哲学意味的,首先说,英文名 PlatON是为了 向柏拉图致敬 。可能大家最熟悉的一个词叫柏拉图式恋爱,千万不要因为这个词就觉得柏拉图是一个很感性的情感专家,实际上柏拉图是一个非常理性的哲学家,在教育、数学、哲学,以及逻辑学方面都有非常多的贡献。柏拉图的很多理念,在今天都依然影响着我们一些计算方面的理论。PlatON的全称叫Plato NetWork,缩写拼在一起,PlatON,这就是英文名字的由来。
中文名字“云图”就更有文化底蕴了,云图分开解读,一个是云,一个图。关于云,大家都知道在数字经济时代,我们的应用和业务都会构建在这个云端。 PlatON的理念也是要在云端构建隐私计算和分布式隐私计算的基础设施 ,所以取了云计算的第一个字“云”。
图的来源有两点:第一,柏拉图名字里面也带有图字,也是向柏拉图致敬;二是有一个学科叫图论,是数学的一个分支, PlatON也是向图论致敬 。其实在区块链领域,像比特币等,都会用到图论的知识,在它的交易数据结构里面有个提法叫做默克尔树,通过交易哈希来逐步构建默克尔树,就是图论中的知识。图论也是影响我们当代计算机科学非常普遍的一个技术分支,所以取了这个“图”字,云+图,最终叫云图。
▌ AI的B面就是数据隐私与主权问题,为何需要大家的关注?
首先什么叫AI的B面,我们定义为隐私和主权。既然有B面就一定有A面,A面从我的角度来看就是便利。在我们生活中大家应该有体会感受,比如我们可以通过语音来操控手机打车点外卖等等。用淘宝会推荐你可能喜欢的东西,头条也会给你推荐关注的新闻,这个就是AI在带给你的便利。
很多时候AI代替了你来思考,让你能够思考的更少,而享受更多的便利,这就是AI的A面。同时,大家也应该能意识到 我们的隐私在这个过程中是正在被AI所窥探的 ,你的行程,你的吃住,都被这些APP以及它的算法,还有背后的这些公司或者个人所掌握。
对我们普通人而言,数据隐私可能没有感觉那么重要,能换取一些便利,也不感觉吃亏。但是当上升到企业的角度,上升到商业的高度,就能感受到非常明显了,企业的财务报表、销售数据、客户信息、产品的研发数据、设计数据,还有运营数据,这些都是企业的财富,甚至可以说是企业的命脉。 数据不像实物资产,它可以无限的复制和传播,数据一旦交出,就失去掌控。
有些时候,为了保护数据,只能选择藏起来,但有时又不得不面临数据必须要去共享。比如银行要做风控,需要多个维度的数据来共同的来识别这个风险,这些数据就包括刚才说到的企业的一些关键数据,甚至还有企业对外投融资的情况、资产负债的情况、抵押的情况、知识产权的情况,司法诉讼的情况、纳税的情况。这些数据越全越准确,风险评估就会越准确。但是这些数据很多都是企业的核心数据,有的还涉及到第三方,因为数据没有保护,谁都不愿意把系统的数据共享出来。而一旦缺乏了这些数据,就很难对风险做一个准确的评估,只能选择最简单最保守的方法就是一刀切。
所以我们看到, 数据隐私与主权的保护不光是一个法律问题或者一个道德问题,它在很大程度上是制约着这个社会经济发展的问题 。这也是PlatON作为隐私计算的网络,一直想要去解决的一个问题。
▌ 简单介绍下PlatON目前的产品和应用?
我给大家简单分类介绍下:
1、DAPP类 ,这个大家应该比较熟悉,包括以太坊就是中心化的应用,PlatON是兼容以太坊的EVM虚拟机,也兼WASM虚拟机。所以大家是可以在上面构建自己的智能合约以及应用的,理论上是能够在以太坊上部署的应用都可以移植到PlatON上,因为它的共识机制,目前是POS类型的,相对于开放1.0的POW他的GPS是大大的提高了,所以说它的应用体验会更好。
目前主要是以Defi类的为主,就是去中心化金融类。因为Defi去年一直比较火,是一个热点,同时PlatON首先聚焦的隐私计算的应用方向就是金融领域。金融领域的需求最明确,数据也最丰富,最全面,数据格式标准化都做得非常好,所以金融领域是一个可以优先来突破的一个领域。上面很多的Dapp选择的都是Defi的应用,包括做Dex的去中心化交易所,类似于Uniswap;也有做资产抵押借贷的,类似于MakerDao;还有基于隐私大数据分析来制定最优的投资策略的。部署在PlatON以及Alaya上的这个这些Defi的应用相较以太坊,它最大的特色是支持数据隐私的保护,像交易数据,挂单数据,这些都是可以在Defi应用中匿名使用的。
2、辅助类的工具 。一种是面向用户的辅助类工具主要是让用户能够更方便,或者更有趣的来使用这个网络。比如说像区块浏览器,还有地址靓号生成器;还有一种是面向开发者类的小工具,让开发者能够在开发的时候降低他的难度,这些工具把一些常用的接口、模块,算法等打包成SDK或者库,供开发者直接调用,能够大大降低开发的难度。官方也提供了这类的工具叫Rosetta,它是做隐私AI开发的框架,有感兴趣的开发者,都可以去尝试试用一下这个框架做自己的AI产品开发。
3、跨链桥 。目前主要是两个跨链,一个是跟以太坊的跨链,一个是和波卡的跨链,主要都是资产跨链。这些就是我看到的主要的一些产品和应用,具体的大家可以在官网和论坛上去看一些更具体的介绍。
▌ PlatON现在的开发进度是怎么样,能不能如期上线?另外主网代币LAT的作用和价值体系是什么?
PlatON的白皮书里面的技术体系有介绍,它做了链上链下的一个分离,链上做共识和验证,链下做计算,即隐私计算。这样既保证了区块链的性能,同时也保证了它的扩展性,然后也兼具安全性。
所以说它的开发部分也包括两块,链上开发的部分就是他区块链本身的一些东西,重点是它的共识机制和虚拟机,之前讲过的智能合约就部署在这个虚拟机上。这块它的开发已经是完成了,并且在他的先行网络Alaya还有新贝莱世界的测试网中都在持续的开展测试,大家可以尝试在上面去部署自己的智能合约。
链下的部分,主要是包括了同态加密和安全多方计算,这两部分目前没有最新的介绍,这方面的开发难度是比较高的,同时也需要链下的一些基础设施的支撑,所以这块还在做一个持续的开发和测试,暂时没有部署到链上。预计可能会在下半年,可能七月份或者更晚能够正式的部署,我也一直在期待这个功能,这是他的非常大的一个亮点。
因为链上部分已经开发完成了,主体功能也比较完善了,所以说大概率四月份,主网会如期的上线,大家期待着这一天就OK。
至于区块链项目的原生代币有什么用,其实大家可能比我更了解,我就给大家讲一下大概的用法有两类:
1、股权类的用法 。拥有代币LAT很多的用户,可以选择自抵押,成为这个主网的验证者节点,成为验证者节点是能够参与链上的共识,或者参与一些治理提案的投票。
那么对于股权少,也就是币比较少的用户,他可以去做委托,就是我们很熟悉的那个词叫staking ,staking给其他的验证者节点,然后来获取奖励,类似于股权分红,这个就是LAT的股权类的作用。
2、货币类的作用。 它可以作为原生的交易货币。我们开始说过PlatON网络解决了数据主权和交易的问题之后,会构建成为数据以及算力的交易市场。那么我们就可以通过这个币去对数据或者算力来进行定价,以及用它去参与交易,购买你想要的数据或者购买你想要的隐私算力。
▌ MPC协议是怎样实现隐私数据提供的技术手段,它的原理是什么?
我简单介绍一下我理解的,首先安全多方计算是适用于双方需要协作的一个场景。A和B,我们两方各有一部分的数据,比如A是腾讯它有社交数据, B是阿里他有电商的消费数据,我们现在需要结合双方的数据进行分析,得到一个更精确的结论。但这个时候就涉及到一个问题,因为在现实生活中腾讯是不可能把数据给阿里,阿里也不可能把数据给腾讯,那么如何在保证大家的数据隐私安全的情况下,大家还能联合来执行算法分析,这个就是安全多方计算要做的事情。
安全多方计算在解决这个事情上用了两个技术路径:一个叫做混淆电路一个叫做不经意传输。数据要联合进行计算,那么首先做的一件事就是把这个算法编译成门电路。这个编译的电路可以通过Fpga或者专用的芯片来实现。
其次要把数据转化成电平输入到电路中,我们知道计算机二进制的不是0就是1,高电平1低电平是0,把这个0101数据输入到电路就可以进行计算。但是,在计算之前,必须对双方的数据进行一个预处理,这个需要通过这个混淆电路来转换。混淆电路的作用相当于是把真实的数据隐藏在一堆假的数据里面,除了数据所有者有一个对照表能够查询哪个是真数据外,其它人都没法得知,这样达到数据混淆的目的让你没法猜测我的真实数据。
另外在联合计算中双方的数据必须要交互,这要用到不经意传输。不经意传输是指:B有一堆数据,要给A,所以A要从B这里面取一个数据走,现在经由不经意传输,A从B这取了一个数据,虽然取走了,但并不知道A是取的是这堆数据里面的第几个。同样的B也不知道A从这堆数据里面是取走的是第几个。你从我这取数据的方式以及我给你哪些数据,这些过程都会暴露一定的信息,不经意传输这个过程是让这个信息暴露的更少。 总的来说通过这样的混淆电路加上不经意传输能够让A和B,都能凭借自己的对照表找出最终算出的真实结果,但是都不知道对方有什么数据,在计算什么 ,这个大概就是安全多方计算的一个原理。
▌ 现实生活中会存在一些计算机的隐私计算技术效率很低,实际商用较少,针对现有这种矛盾有比较好的这个解决办法吗。
这两个问题确实是隐私计算在推进应用落地的过程中很典型的问题,第一个问题就是隐私计算它的效率偏低,我们首先要理解这个词,如果我把隐私计算跟直接计算来相比较的话,隐私计算的效率确实是低。因为他 要做很多额外的操作来保证这个数据的隐私,这些额外的操作必然降低效率,这个是绝对无法避免的 。
但是当具体到某应用场景之中的时候,就不一定了。随着这些年密码学技术的一个快速的发展,在针对某些特定应用场景的特定算法下,隐私计算的效率虽然确实不如直接计算那么高,但是他针对这个场景所需要的需求,已经足够了。
就像手机和电脑,手机的性能永远比不上同样技术的电脑,但现在我们已经可以用手机来做一些应用,比如说编辑文档、PS图片啊,很多年前手机做不了这个,但是现在的手机就可以了,虽然现在手机的性能还是比同时代的电脑低,但是已经超过了应用所需要的性能需求,那它就可以用。 效率低不代表不能用,因为它是一个相对的概念 。
第二个问题应用场景较少其实有两方面原因:
1、隐私计算还没办法做到大规模的通用,只能在针对某些应用场景使用,所以说肯定会受限。
2、隐私计算它的基础设施还不是特别的完善。我们今天用云计算很容易买到的资源,像阿里云,腾讯云等,这些用于计算,它的基础设施很便利很好用,但是我们想用隐私计算的基础设施的时候,我发现很难选择甚至没有太多的选择,所以它不够便利,不够简单,这也制约了我们应用的发展。
关于这两个问题我认为没法避免,但是可以逐步解决,一是 寻找与隐私计算技术能力或者性能相匹配的应用场景 ,让它去使用,没有必要上来就想解决所有的问题。二是既然我们已经把隐私计算量跟区块链相结合了,我们就可以 发挥区块链共建共享的属性,来推动隐私计算基础设施的大规模铺设 。
▌ PlatON接下来就是准备如何布局,如何打造更优秀的分布式隐私AI平台?
PlatON Cross作为一个去中心化协作的区块链项目中的一方,严格来说我们是没法左右包括官方以及其他的协作方如何发力的,因为每一方可能都有自己的立场和原则,还有一些现实的制约。所以说这个问题我没法代表官方来回答,我只能说从我看到的和我认为的来回答这个问题。
我认为 第一个方面是技术方面 ,虽然我们永远都在强调说,技术不重要,市场重要,但其实技术非常重要,因为它是一个底层的一个支撑。在技术方面,我认为有三点。
-
隐私计算、密码学 永远是道高一尺魔高一丈,有了先进的加密技术保密技术,同样也会不断的有相应的解密技术和破解技术出来,所以这块基础理论的研究,是需要持续的与时俱进的,需要官方持续的下工夫,事实上看到的好像也确实是这样。
-
链上的功能,PlatON需要逐渐的完善 。目前它是支持以太坊EVM的智能合约,但是他的隐私计算的合约还没有部署到链上去,所以也需要不断的逐渐完善,让大家能够更好的来体验到。
-
PlatON 白皮书里面规划的隐私计算芯片 。它规划了要做自己专用的芯片,来提升这个性能也好,还是保护安全性也好。那么在芯片设计制造这方面,我们国家是大力在发展中国芯,这块其实可以跟一些国家核高基课题以及一些高校的课题来结合,共同推进芯片这块的一个发展。
另一方面,我们既然已经投身了区块链,是可以 通过区块链共建共享的特性来提升基础设施的这个建设速度和这个覆盖范围 。其中一个做法,就是引导传统的一些矿工来转型升级。其实有很多比特币的旷工,为比特币挖矿在提供无意义的哈希算力,这对比特币是有意义的,但是对数字经济、实体经济是无意义的。他们很多人都有这样转型升级的一个意愿,可以引导逐步引导他们转型升级来为隐私计算网络来提供有意义的隐私算力的。
在 社区方面,我认为需要多维度的互动和引导,不能局限 。因为我们知道社区里面都有不同的受众,大家有不同的关心点,有人关心技术,有人关心发展的理念,关心前景,有人关心token。那么这方面都要覆盖,多维度的互动和引导,然后在这个过程中共同来发掘同路人,对PlatON生态认可的一些同路人,然后一起来推进生态的发展。
最后, 要为隐私计算寻找适用的应用场景 ,不求一开始就面面俱到,要去找他最适合最匹配的应用场景,来聚焦、来突破、来做案例,然后培养用户的习惯,让更多的人能够接受隐私计算这样一个理念,让更多的人能够意识到他们自己的数据是有价值的,然后进而不断的加入这个生态。