PlatON2.0的白皮书已经发布,包含了项目未来重要的发展脉络。如果说在1.0时代,PlatON只是告诉人们是一条做”隐私计算“的公链,那么在2.0的白皮书当中,对于未来发展的方向、层次乃至细节都做了更详细的阐述。抛开白皮书中各类详细的解读与分析,一个核心词汇走入我们的实现,他就是PlatON技术路线中核心点”多方安全计算“。本人希望从相关技术理论角度切入,一窥PlatON发展之路。
多方安全计算及其关键技术:
多方安全计算(Multi-partycomputation,MPC),又被称为安全计算(SecureComputation,SC)或安全多方计算(SecureMutli-partyComputation,SMC),是密码学的一个基础分支。多方安全计算协议能够实现互相不信任的人在无可信方的情况下共同完成某个计算目标,同时又不泄露各自的隐私输入。其经典引用包括匿名电子投票、商业策略共享,最近也在智能医疗、军事保密等领域也得到了广泛的关注。同时,数据挖掘算法的不断发展,也让越来越多的人期待能在多方安全计算的架构下,实现保护隐私的数据挖掘,这也是PlatON的一个重要发展方向。
自MPC理论创立以来,已经衍生出多个技术分支,包括混淆电路、秘密分享、同态加密和不经意传输等。
混淆电路(garbledcircuit,GC)是姚期智于1986年提出的安全两方计算协议,参与方在不知晓他人数据的前提下,使用私有数据共同计算一个用逻辑电路表示的函数.大多数混淆电路方案支持2个参与方计算,其性能优化集中于优化单个电路门的密文数量、传输的电路数量等.近年来多参与方计算的混淆电路方案相继提出.混淆电路的优点是能在恒定轮数内完成计算,只涉及开销较小的对称加密运算;缺点是通信量和电路大小呈线性关系,因此不适合计算复杂运算,只适用于比较大小等简单的逻辑运算。 在PlatON的愿景中,会支持更多复杂的场景,因此混淆电路应该不在PlatON的技术范围之中。
秘密分享(secretsharing,SS)由Shamir和Blakley于1979年分别提出,数据拥有方计算秘密数据的份额并将其分发给计算方,计算方对不同秘密的份额计算,得到计算结果的份额.由于秘密拆分方式不同,秘密分享分为基于多项式插值的秘密分享和加性秘密分享(additivesecretsharing).加性算术秘密分享能够计算线性运算、加性布尔秘密分享能够计算比较大小等非线性运算.加性秘密分享只需要进行简单的运算,计算开销小,在MPC中得到了广泛的应用.秘密分享的缺点是交互轮数和电路深度有关.
不经意传输(oblivioustransfer,OT)由Rabin于1981年提出,消息发送方拥有多个消息,接收方获得其中某个值,发送方不知道接收方的选择信息.其衍生技术相关不经意传输(correlatedoblivioustransfer,COT)可以生成具有关系的随机数.OT,COT是重要的密码学组件,能够为GC传输导线标签、为SS生成相关随机数,只使用OT技术也能实现MPC协议.在OT的性能优化历程中,OT扩展(OTExtension)技术引入对称加密来降低计算开销,静默OT扩展(silentOTExtension)技术在本地扩展随机数种子来降低通信开销.
同态加密(homomorphicencryption,HE)的概念由Rivest等人于1978年提出,可以在无需解密的情况下直接对加密数据执行计算.在发展过程中先后有部分同态加密方案与浅同态加密方案提出,直到2009年Gentry构造出首个全同态加密方案.同态加密的优点是能以最小的通信成本设计轮数较优的MPC协议,缺点是乘法同态运算会带来较大的计算和存储开销,目前加法同态在实际中应用较多
以上4类 MPC技术在计算性能、通信效率和存储开销等方面都具有各自的优势和劣势,单一的 MPC技术往往不能满足实际应用中计算复杂函数的需求,需要将多种 MPC 技术相结合才能获得性能均衡的实现方案.
PlatON技术定位与竞争分析
在2.0 白皮书中,PlatON对自身的定位与竞争分析做了阐述,如下图:
PlatON作为一条底层公链,具备优越的去中心化、安全性、性能及合约开发支持。与目前现有的一些主流公链做了对比分析,这些公链或主打隐私计算或以构建WEB3网络基础设施为目标。PlatON则更侧重与构建隐私保护计算网络及人工智能协作网络,主要应用是人工智能的训练和服务,以及自主代理。通俗来说,PlatON上除了传统的应用生态外,可能会更侧重于隐私保护相关生态的构建,同时可以支持机器学习过程中数据的隐私安全,以及训练完模型的代理,形成一整套隐私计算的闭环。
PlatON作为一条底层公链,具备优越的去中心化、安全性、性能及合约开发支持。与目前现有的一些主流公链做了对比分析,这些公链或主打隐私计算或以构建WEB3网络基础设施为目标。PlatON则更侧重与构建隐私保护计算网络及人工智能协作网络,主要应用是人工智能的训练和服务,以及自主代理。通俗来说,PlatON上除了传统的应用生态外,可能会更侧重于隐私保护相关生态的构建,同时可以支持机器学习过程中数据的隐私安全,以及训练完模型的代理,形成一整套隐私计算的闭环。
在隐私计算这个细分场景上,白皮书有如下的对比描述:
PlatON项目重点关注隐私计算跟AI的结合,相比其他几个具有隐私计算特色的的公链项目(包括 Enigma、Oasis以及Phala等):
- PlatON采用的隐私技术路线不一样,PlatON采用基于密码学的安全多方计算技术,而Oasis、 Enigma和Phala则主要采用TEE技术。
- PlatON还是独立的完备的区块链网络。 PlatON支持更复杂的机器学习的隐私计算,PlatON也将面向AI提供专用的隐私计算加速硬件。
- PlatON更聚焦于AI模型的隐私训练和AI代理的构建,以及AI代理的互操作,而不仅仅是区块链网络 的layer2计算增强。
支持同样场景的技术,可信执行环境(TEE)与联邦学习也在致力于达到相似的目的。
其中可信执行环境是构建一个独立于操作系统而存在的可信的、隔离的机密空间,数据计算仅在该安全环境内进行,通过依赖可信硬件来保障其安全。
可信执行环境最本质的属性是隔离,通过芯片等硬件技术并与上层软件协同对数据进行保护,且同时保留与系统运行环境之间的算力共享。目前,可信执行环境的代表性硬件产品主要有Intel的SFX、ARM的TrustZone等。
而联邦学习的本质是分布式的机器学习,在保证数据隐私安全的基础上,实现共同建模,提升模型的效果。三者的对比如下:
整体来讲,PlatON在隐私计算的选型上选择了更加通用、高效的多方安全计算方法。针对另外两种方案,也在自身的隐私AI开发框架Rosetta上进行了支持。
PlatON中MPC的具体应用及潜在场景
在PlatON 2.0白皮书中,隐私计算网络Metis ,就是综合利用多种方法的一种可实施技术路线。如下图中,目前已经发布的PlatON区块链网络支持EVM与WASM虚拟机,作为图下方的支撑部分,通过合约实现人工智能市场及去中心化的资源管理与调度,在隐私计算部分,包含两种类型: 左侧的隐私外包训练与右侧的安全多方训练,分别采用我们前文提到的同态加密(HE)方案与秘密分享(SS)方案。
PlatON 2.0白皮书中,Metis担任Layer2隐私计算网络的角色,通过隐私计算网络讲数据、算法和算例结合起来,构建完整的计算生态。包括个人和机构在内的所有主体都会由于经济上的激励来提供个人和专业数据。根据个人理解,Metis上线后,首先可以实现算力的灵活交易与调度,此时PlatON承载了相关清结算功能。同时,在训练过程中,可以实现数据“可用而不可见”,提高训练过程中的数据隐私性。
在PlatON 2.0 白皮书的第五章中,已经详细的阐述了未来可能应用的生态。包括人工智能预言机、游戏、生物医药、金融风控、智慧城市等方向。
以金融风控为例,通过隐私计算技术,运营商、互联网平台、保险机构等多方数据通过密态方式开放更多的风控类私域数 据标签与银行进行协作,支撑金融风控业务,实现贷前、贷中、贷后全流程监控,提高风控及时性。通 过隐私求交集与隐私联合查询,可方便统计了解客户综合信用风险,且不泄露任何一方的客户ID与私域 数据信息,形成风险联防联控联生态。
除了白皮书中提到的一些应用场景之外,我们可以再介绍联合营销、电子政务等方向上的应用。
联合营销
随着营销业务进入智能时代,应用于营销的数据维度不断丰富,应用场景也不断增加。用户画像的数据往往是相互割裂的,只有通过整合多机构间、多维度的数据才能构建更立体的用户画像。利用隐私计算可以帮助机构在不输出原始数据的基础上共享各自的用户数据进行营销模型计算,根据建模结果制订营销策略,实现双赢的联合营销目的。
在构建营销模型中,通过隐私计算技术,对交互的标签、特征、梯度等数据进行等密码学处理,保证密文接收方或外部第三方无法恢复明文,直接基于密文进行计算并获得正确的计算结果,从而达到各参与方无需共享数据资源即可实现联合构建营销模型,从而进行精准营销。
在高价值用户识别中,可以利用隐私计算技术,通过联合统计、隐匿查询等方式将内部和外部数据进行安全融合,打通多方数据孤岛,利用外部数据更精准的对用户客群进行分类,识别高价值用户,制定更精准的营销策略。
银行机构利用隐私计算技术,可对运营商、政务、征信等数据实现应用场景所需的价值融合,从而为用户提供聚合金融服务。保险公司将用户基本信息、购买保险、出险赔付和电商、航旅等其他合作方的消费、出行、行为偏好等数据进行安全融合。通过匿踪查询技术可信地获取客户的黑名单、消费能力、画像标签等信息,用于识别消费者的潜在风险等应用。电信运营商通过融合金融机构数据在共有的用户群中找到对理财产品、保险产品感兴趣的用户群,筛选找到更精准的目标用户进行营销,提升交叉销售效果,获取更多的新客。互联网公司利用自身拥有的大量用户行为信息和基础画像数据,与广告数据方拥有的深度转化链路数据(如付费信息)进行安全求交,并通过多方安全计算或联邦学习技术联合训练、建模、优化广告模型效果。在游戏、金融、教育、电商行业的广告应用案例中都能提升广告投放效果和用户体验。
电子政务
隐私计算技术为政务数据的开放提供了有效解决方案。在企业自有数据、第三方数据或政府共享数据都需要保护且不能离开本地节点的场景下,基于隐私计算进行数据安全利用。
在政务数据共享上,政务公共数据分布在各部门,通过隐私计算技术搭建政务公共数据密文开放共享交换平台,打通跨域数据的应用价值链,使得数据基于业务应用需要在各业务条线之间,安全地共享和流通,实现数据安全共享融合而不泄密。
在政务数据开放上,政府机构建设保护各方隐私安全的公共数据开放平台,使用隐私计算技术融合政府数据和社会、企业数据进行安全计算,联合统计,联合建模,实现数据融合价值,可以广泛应用在信用评估、服务选址、健康医疗、家政服务、旅游投资、营销设计等众多领域,让政府部门掌握的数据在安全保护前提下,最大限度造福社会。
小结
总体来看,白皮书中描述的内容是务实且具备前瞻性,当然也充满了挑战。 PlatON主网目前已经实现了作为底层基础设施的任务,后续应该会持续优化生态及做好更多的兼容性。 Metis主打隐私计算与机器学习的结合,目前也是学术研究及探索的重点,尽早完成开发有利于利用先发优势,扩大影响力形成标准。AI自治网络Horae计划制定出AI代理互操作协议,再探索AI代理真正的自主,立足长远。 本文只是从多方安全计算入手做了对比,PlatON规划更为长远,通过应用相关技术,完善整体生态,未来可期。
部分文献:
- 多方安全计算协议及其应用研究
- 多方安全计算及其在机器学习中的应用
- 隐私计算联盟《隐私计算白皮书(2021年)》