直播实录丨隐私泄露事件频发,隐私计算如何化解?

3月25日下午17点30分,PlatON算法科学家谢翔博士受邀做客TokenInsight《对话首席》线上AMA系列活动直播间,围绕近期新浪微博平台用户隐私泄露事件发表看法,探讨如何运用隐私计算保护数据隐私,同时分享了PlatON隐私计算最新进展。本次直播也得到了链闻、金色财经、PANews等媒体的支持。

以下是本次直播精彩实录:

1. 不知道您最近有没有看到关于新浪微博平台用户隐私信息泄露事件的相关消息,这件事受到了很多网友的关注。其实这并不是第一次新浪微博的泄露事件,早在2011年新浪微博就发生过一次比较大型的XSS攻击事件(跨站脚本式攻击),能否请您谈一下关于这个事件的一些看法呢?

其实我们的理解是,现在的互联网行业在一定程度上获取隐私数据,以此盈利。比如新浪微博,在平时收集到大家的隐私数据,因为一些操作或管理的失误,很容易造成隐私泄露的问题。

这里涉及到两个方面:其一,传统互联网巨头的行业模式与用户隐私保护之间的矛盾,这一点不可跨越。我们希望在新的架构上避免这一点;其二,互联网偏中心化的模式也会带来隐私泄露的隐患,虽然在管理上或者业务处理性能上有较大的好处,但对于隐私安全来说,是存在风险点的。比如新浪微博的问题,本质是一个管理上的问题,没有很好地管理隐私数据,导致最终的泄露问题。

但必须承认的是,信息泄露的解决在技术上是一个非常复杂的过程,不是简单地依靠换技术或换架构就能颠覆的。只能说,我们更倾向于分布式的架构,所有的数据被保护起来,这与以往单纯存储数据是不同的。

我们认为,隐私计算是唯一能改变现在隐私泄露频发趋势的新方式,这也是我们的初衷。

2. 其实这种拥有大量用户的平台发生信息泄露的事件时有发生,这次新浪微博的泄露事件也是有人用爬虫、连接API等方式暴力获取了相关数据。我们知道PlatON主要的研究方向是隐私计算,能不能从您的角度分享下PlatON的技术是否能够用来解决大型平台信息被人暴力获取的问题呢?

很多隐私的问题都是在数据使用中出现的问题,PlatON隐私计算其实就是致力于在数据流动的过程中保护数据的隐私。

PlatON隐私计算的基本思路就是利用密码学技术,保证数据在使用的过程中不泄露隐私数据。不能说完全解决隐私泄露问题,但至少提供一种新的解决方案,降低黑客泄露信息的可能性或提高泄露信息的成本。

我们的定位分为两种。一种是基于区块链来搭建分布式经济体基础设施,为上层的经济活动提供平台;另一种是隐私计算,让数据在真正的流动过程中把关键部分隐藏起来。

基于这两者,我们是希望搭建一个全数字化的分布式基础设施。当然,我们内部是对这个目标的难度是有充分认知的,将会长期投入来完成,并吸引更多开发者参与搭建。

我们希望能为现在严重的隐私问题做出一些贡献,但具体能做到什么地步,还需要等到五到十年之后,当我们有了一定积累,基础设施更加完善后再来评判。对这件事情,我们是充满信心的。

3. 随着数据时代的到来,隐私受到泄露的事件也不断发生。隐私计算是一个在传统行业和区块链行业都备受关注,同时又具有较高技术含量的研究方向。有人说区块链技术天生适合隐私计算,能否请您针对这个观点分享一下您的看法呢?

其实这里涉及到一个理解误区。我个人认为,区块链和隐私计算其实是没有关系的。

区块链最原始的形态是比特币,如果大家读过比特币相关的白皮书,就会了解到,比特币是没有任何隐私保护的。另外,大家对于比特币、区块链有一些概念上的误解,比如说Cryptocurrency,准确的说法是密码货币,不是加密货币。因为从密码的角度,加密只是密码学里面一个非常小的部件,而有加密就一定会有解密。在密码学的圈子里,经常拿这个来看玩笑,如果有加密货币,就一定会有解密货币。

而且,在区块链或比特币里面,其实没有用到太多密码算法,最多用了签名和Hash。

区块链共识的本质是所有数据完全备份,并向所有人公开,从一开始就不具有隐私保护的功能。当然,区块链为我们提供好的东西,有可能提供分布式基础设施,实现支付功能。

因此,区块链和隐私计算是相对独立的,但又必须联系在一起。打个简单的比方,隐私计算在上层和业务联系,能够保护数据的隐私;区块链在下层作为分布式经济体基础设施,提供支付和结算的功能。这对应到PlatON团队的分工,隐私计算团队和区块链团队是并行的,只是在后续将结合在一起。

4. 专注隐私计算方向的项目目前的技术路径都不太一样,能否请您介绍下PlatON项目在隐私计算上主要技术架构呢?

隐私计算是一个大的范畴,每个团队实现的路径各不相同。而PlatON是以密码学技术为主,结合可信硬件等技术来实现隐私计算。从底层往上来看,有基础的密码学算法,有区块链,有隐私AI框架,有隐私数据平台产品。

实际上,密码学技术和可信硬件技术各有优劣。密码学技术从算法层面来说,有足够强的安全性和理论支持,但代价是性能不够;而基于硬件,需要对某一实体有强大信任,优势是性能好。在商用上,我们往往要根据需求来选择。而PlatON的选择是先以密码学为主,再逐步扩展到隐私AI的技术。

原因很简单,我们不是纯粹为了做技术而做技术,我们的最终目的是交付可部署、可运营的商用产品,密码学只是一种技术实现。

在密码学技术上,我们会结合安全多方计算、零知识证明和同态加密等技术来保护数据隐私,这是我们最擅长的地方。在此基础上,我们后续再集成类似TEE的可信硬件技术来达到客户的要求。

总结一句话,就是我们以最终的交付为最终目的,而不是以纯技术为最终目的。

5. PlatON在2019年的活动中曾经说过2019年将是隐私计算元年,能否请您分享下2019年PlatON最大的进展以及2020年的一些发展规划呢?

首先说下背景:2017年初,考虑到国内外数据隐私保护现状,将可能导致新兴市场的产生,PlatON加大对密码学的投入,并与国内外权威密码学专家密切接触,邀请加入我们的队伍。当年9月份,在万向峰会时,开始提出安全多方计算的概念,但当时大部分人对此还不太了解。

从2017年初到2019年,我们进行了一些探索,包括技术选型、工程化等方面的探索和确定。期间,也就是从2018到2019年,市场上普遍都是“安全多方计算”的声音,我们也由此看到了隐私计算的巨大潜力。

当然,从认知到实践,还是有一定过程的。我们意识到,如果只是泛泛地做隐私计算的话,是没有固定的目标市场的,也不知道为谁服务和如何提供服务。由于在AI层面,市场前景和应用广泛度足够大,将隐私保护技术和AI结合,将发挥前者更大的作用。

基于此,2019年,我们在隐私计算领域最大的进展是确定了隐私AI作为未来的核心方向,组件了强大的AI团队,并与密码学团队一起确定了技术框架和产品框架。

而2020年,我们在隐私计算最为重要的两个工作是隐私AI框架Rosetta的发布和数据银行产品的发布,并基于此开展一系列产品及社区的推动工作。隐私AI框架Rosetta是我们将密码学和AI框架(例如Tensorflow)相结合进行开发,让AI工程师没有瓶颈地开发产品。希望通过开源的方式吸引更多的AI开发者、工程师或密码开发者做贡献。

当然,我们的最终目标是实现商用,并不纯粹是为了开源,所以我们在该框架下搭建数据银行的商业产品。

以上就是我们在隐私计算领域的整体规划。

6. 之前采访PlatON创始人孙总时,曾倡导“万物互联”的概念,请问是否由物联网在硬件层面提供大量的数据,为隐私AI提供养料?

其实这里涉及到一个大的理念,即我们不应纯粹地从技术的角度看问题,而应从数据的整个生命流程看问题。

数据的生命流程分为数据的采集和生产、储存和计算、分发和交换、分析和处理等四个阶段。

物联网是在数据的入口,通过先进设备进行数据的收集,PlatON与物联网相关的合作方共同搭建相关生态;关于数据的分发和交换,我们认为是以分布式账本为代表的新技术为主来实现;而数据的分析和处理则主要用到AI和大数据进行处理。

PlatON是基于整体进行布局,本质目标是在数据的全生命流程当中,通过隐私保护的方式,促进数据的流动。

7. 我知道PlatON最近公布了Grants计划,可以请您分享一下相关的内容吗?

Grants计划是PlatON建立社区的一个非常重要的渠道,是吸引开发者为社区做贡献的绝佳方式。如果开发者成功申请Grants计划,我们将提供一定的经费来赞助。

自发布以来,我们收到了很多社区朋友的申请。主要包括区块链方向的项目和隐私计算的项目,申请的主体包括高校、初创公司、社区团队等。而项目的内容包含了区块链周边工具、合约开发等。密码学方向包括安全多方计算、零知识证明、同态加密的算法实现、应用和软硬件加速等。

因为我自己来自密码学界,所以很清楚地知道它的难度所在。或者说,在这个领域,一定是需要有很多人一起来做贡献,完全依靠一家公司来达成一个长远目标是很难的。所以我们希望更多对密码学、区块链等感兴趣的开发者参加,共同推动PlatON生态。当然隐私AI也属于Grants计划,同样欢迎大家参与申请。

8. 能用几句话简单介绍下同态加密、零知识证明和安全多方计算吗?

安全多方计算是保证数据不会汇集在一起,又能对数据做计算。它涉及到一个经典例子,即有两个百万富翁,要比较谁更有钱,但不想把财产的数量告诉对方。这最早是由姚期智先生提出的。“安全”是首先保障财产或隐私的安全性,“多方”是多个参与方,“计算”是致力于解决什么事情。比如百万富翁问题是比较财产数量的大小,这可以扩充到其他更复杂的密钥场景里去。

同态加密可以理解为数据是看不见、拿不走的,但是可以对它进行计算。这涉及到一个故事:Alice是个很富有的人,拥有很多金块,需要请工人来将金子打造成首饰。但金子在打造的过程中会被分成碎片,她担心碎片会被工人拿走。所以她想了一个办法,将大块的金子用透明的箱子锁起来,工人可以戴上手套在箱子里操作,然后Alice等工人离开并将首饰拿出来。

这是一个形象的比喻,如果把金块当成数据,那么盒子就相当于对数据做了加密,工人的手套意味着可以对加密的事物做操作。“同态”在数学里是一个映射的关系,在外面操作可以对应里面的操作,在这个例子里,就是可以通过手套在外面对里面的金子进行操作。

零知识证明也有一个故事,即阿里巴巴和四十大盗的故事。阿里巴巴知道有一个埋藏宝藏的地方的钥匙,而强盗要求阿里巴巴把钥匙交出来。这时,阿里巴巴面临一个窘境:如果钥匙交出来,他会被强盗杀死,如果不交出去,可能强盗不知道钥匙的存在,觉得他没有用处,也可能将他杀死。所以,有没有可能,阿里巴巴告诉强盗他知道这个钥匙的存在,但不告诉强盗在哪,暂时保命。这是一个经典的零知识案例,向别人证明我有这个东西,但这个东西是什么又不告诉别人。

以上的三种密码学技术,慢慢被市场认知,但仍有一些瓶颈和不足。目前来说,普遍性能有待提高,不同技术的瓶颈是不同的。比如安全多方计算,瓶颈在通信上,需要很多的带宽来进行通信;而零知识证明和同态加密,需要大量的计算力,提高计算的速度。

对此,国内外专家都在推进和尝试,并促进技术的落地应用。而PlatON所做的,在安全多方计算方面,是在算法上做改进,将通讯量调到尽可能低,将通讯的负担挪到计算的负担上去,采取折中的方式。关于零知识证明和同态加密这两方面,我们在杭州有一个硬件团队,希望用硬件的方式提升计算性能,这也是我们Grants计划当中涉及相关硬件实现的原因。

9. 请问零知识证明能否实现大规模商用?现在的需求有多大?

零知识证明的证明内容和业务是相关的。比如现在区块链比较普遍的应用,range proof,只要向别人证明转账的钱比余额少。我们的目标是要去解决具体的问题,而完全的通用是没有太大意义的,并且我们发现在某些具体的场景里已经足够用了。

当然,当需求越来越复杂时,算法将不断改进;当算法越来越好时,场景也能用得上。所以,这是一个慢慢迭代的过程。目前来说,零知识证明还处在偏早期、没有完全成熟的状态。

10. 请问安全多方计算业务的真实需求和实际业务是什么?

其实安全多方计算和隐私AI有非常契合的点,相关的需求更加急迫和明确。这里涉及到数据的归集和数据的使用的矛盾。从隐私AI的角度,数据一定是越多越好,让模型更加精确;但从数据资产的角度,大家的数据是越来越不想给出去的。这个矛盾在AI领域越来越凸显。

安全多方计算是非常适合解决这个问题的主要工具,提供一种范式来解决这个困境。所以我们发现,密码学其实是被用来解决各种矛盾的。基于此,相关B端企业对此需求非常强烈。

目前,国内外都在探索如何将隐私保护技术和AI进行结合,很多主流机构都在入局这个战场,而PlatON目前是比较靠前的,我们的优势是在局部战场的投入更大些。

11. 您怎样看待以太坊加入隐私计算的生态?

我觉得是必然趋势,以太坊号称是“世界计算机”,需要承载大量的数据,势必涉及隐私的问题。因此,以太坊将更多地使用密码学技术,来支撑整个网络的完备性。其实,以太坊2.0的设计有非常多与隐私保护或密码学相关的工具和想法。另外,我们很看好以太坊,并且有关于MPC方面的合作,在社区之间也有互动。

在直播的最后,谢翔博士总结道:未来是隐私计算的时代,将重构现在大部分互联网的商业模式,而隐私AI奠定了人类在全数字时代的生存方式。希望借助这个机会,呼吁更多的人参与隐私计算网络的搭建。

他表示,密码学是人类先人智慧的结晶,由一个个具体的问题引发,让大家对这个世界有新的认知。后续“PlatON”公众号将推出一些与密码学相关的技术科普,希望更多的人能了解并投入密码学领域,一起搭建隐私计算网络和分布式经济体基础设施。
微信图片_20200227211445
扫码获取PlatON更多详情,还有技术干货哦!

1 个赞