PlatON隐私AI计算网络是可验证计算、安全多方计算、零知识证明、同态加密等密码学算法和区块链技术共同组装的隐私安全计算体系,为全球人工智能、分布式应用开发者、数据提供方及存有计算需求的各类机构、社区和个人,提供开源架构下的分布式经济体公共基础设施,为数据的 确权 与 流转 提供了去中心化的底层技术支撑。确权能够为数据带来资产属性,因此,未来数据的流通其实是资产的流通。Lat作为PlatON的原生Token,可以在其应用程序中使用,是PlatON未来数据和算力流通市场的核心清结算媒介。
数据确权的含义
数据确权,就是赋予数据主体应有的权利。GDPR[1]规定了数据主体(即自然人,例如用户、客户、商业联系人、雇员、前雇员、求职者等,不包括法人主体)的8项权利:
- 知情权 (Right to be Informed)
- 访问权 (Right of access)
- 更正权 (Right to rectification)
- 删除权 (或"被遗忘权",Right to erasure, or “right to be forgotten”)
- 限制处理权 (Right to restriction of processing)
- 可携带权 (或迁移权,Right to data portability)
- 反对权 (Right to object)
- 不受制于自动化决策(含画像)权(Right not to be subject to automated decision-making, include profiling)
知情权 (Right to be Informed)
知情权是指数据主体对数据控制者相关信息的知道的权力。当直接向数据主体收集时,控制者应向数据主体提供:
- 控制者及法定代表人、数据保护官(DPO)的身份、联系方式。
- 个人数据的种类。
- 处理个人数据的目的和法律依据(GDPR规定了六种法律依据,分别是数据主体同意、法定义务、合同义务、保护数据主体或他人的核心利益、公共利益、数据控制者或第三方的合法利益,至少需要具备其中的一种);
- 数据是否向第三者或第三国转移、接收者是谁。
- 存储期限或标准。
- 保护措施。
- 声明数据主体有权访问、更正、删除个人数据,以及限制、拒绝、撤销同意的权利。
- 向监管机构投诉等权利。
- 提供个人数据对于法律或合同的必要性,数据主体是否有义务提供个人数据,或者不提供此类数据可能造成的影响,如不能处理交易等。
当通过其他渠道间接获取时,应向数据主体提供:
- 除上述最后一条(法律或合同的必要性)之外的其他所有信息。
- 数据的来源。
且需要在一个月内通知数据主体,并一次性告知上述信息;如果个人数据是用于跟数据主体沟通,可以在第一次沟通时通知。
访问权 (Right of access)
访问权,是指数据主体有权获取如下信息:
- 确认其个人数据是否被处理、处理的目的(用途)、数据类别、存储期限或标准。
- 权利信息(更正、删除、限制、拒绝的权利)。
- 个人数据的副本。
更正权 (Right to rectification)
更正权,是指数据主体有权更正错误的个人数据。
删除权 (被遗忘权,Right to erasure, or “right to be forgotten”)
删除权,是指数据主体有权删除自己的数据。典型场景为:用户有注销账号的权利,控制者有配合删除其个人数据的义务。
限制处理权 (Right to restriction of processing)
限制处理权,是指在特定场景下,数据主体有权要求数据控制者限制对他的个人数据的使用。在数据主体认为其个人数据还需要保留,但数据控制者不得使用时,可提出限制处理请求。典型场景为:
- 数据不准确:某用户发现自己的燃气费自动扣款金额不对,要求暂停自动扣款,待核实后再决定是否恢复。
- 处理数据的行为没有法律依据,或者使用了非法的手段。
- 数据虽然已不再需要用于原来的目的,但有可能需要作为法律证据保留,这时用户可要求限制处理,但并不删除。
- 处理数据的法律依据是为了公共利益,或数据控制者及第三方的合法利益。
可携带权 (迁移权,Right to data portability)
可携带权,是指数据主体有权要求将自己的数据,转移到另一家数据控制者,数据控制者应当配合。典型场景为:博客的主人,有权将自己发布的博文,搬家到另外一家服务提供商。
反对权 (Right to object)
反对权,是指数据主体有权撤回之前自己的同意,但是不影响在撤回之前基于用户同意所做的处理。
如果处理数据的法律依据是出于公共利益,或者数据控制者及第三方的合法利益(即处理个人数据的六个法律依据中的最后两个),用户有权提出反对,数据控制者须立即停止这部分的数据处理。
例如商家为了促销,发送营销邮件或拨打用户电话,用户有权提出反对,要求商家不再骚扰自己。又如,某应用会根据用户的浏览记录,推送相关的广告,如果用户对这一做法表示反感,可以行使反对权,拒绝定向广告。
特别说明:电子隐私法对于数字营销有进一步的约束,需要获取数据主体的明示同意。
不受制于自动化决策权 (含画像)(Right not to be subject to automated decision-making, include profiling)
不受制于自动化决策权,是指数据主体拥有不被限制于自动化决策的权利,因为自动化决策算法本身过于复杂,比如神经网络,对大众来说不够透明也难以理解,用户不清楚自己的数据是如何被处理的,决策的结果可能影响到自己的基本权利和自由。比如某用户通过在线申请某银行的信用卡时,该银行于用户画像自动做出驳回信用卡申请的动作,那么该用户有权反对、投诉这一决策,并要求人工干预。
特别说明:自动化决策(含画像)需要获得用户的明示同意。
PlatON如何为数据确权
总的来说,PlatON提供了基于密码学算法和专用硬件的软硬结合隐私计算技术体系,确保数据所有权、使用权的分离,保障数据主体的权益。
PlatON安全多方计算、同态加密,能够确保计算节点在无法获取到数据含义的前提下,对数据进行处理, 这意味着在PlatON网络中,数据可以在不暴露任何含义信息的前提下,自由流转。
同时,PlatON可验证计算、零知识证明,可保证某计算过程是切实执行了的,其执行结果是真实有效的。 这意味着在PlatON网络中,数据主体可以要求控制者执行某种验证过程,证明其提供的信息、对数据执行的处理是真实有效的。
考虑这样一种典型场景:假设A是数据主体,拥有一份有价值的数据d,参与者B想要对数据d进行数据挖掘,或用于AI模型的训练。如果A将数据按照传统方法直接拷贝/发送发送给B,那么A的所有数据主权几乎都无法得到保证。
首先,由于数据的易复制性,B获得数据后可以任意复制发送给其他人,这一点无法从技术上限制,所以A的知情权将受到侵害。即使B获得数据后不向其他人转发,他也可以不向A提供知情权包含的全部信息,或者提供虚假信息,数据主体A的知情权同样会受到侵犯。
其次,同样由于网络中数据的易复制性,导致可携带权(迁移权)无法得到保证,因为接近无成本的复制操作,实际已经没有迁移的必要性。同时B可以对数据明文进行任何处理,导致访问权、更正权、删除权、限制访问权以及反对权遭到侵犯。
最后,B将数据用于神经网络模型的训练,由于复杂性,A(其实甚至包括B在内),都难以监控咋整个训练执行过程中,对数据进行了怎样的处理,导致数据主体难以做出有效决策。同时,由于是对明文处理,数据主体也难以做出明示同意的决定。此时,不受制于自动化决策权无法的到满足。
因此,虽然数据已经由互联网承载和流转了五十多年,但依然不具备完整的资产属性。PlatON隐私AI计算网络基于完备的软硬结合密码学体系,在技术上提供了数据资产化的可能性。
首先,当B向A索要数据时,A可通过 PlatON可验证计算 向B询问其关心的诸多信息,B在提供相关信息的同时,还需要提供可验证证明,确保信息的真实性。而A在给予B数据之前,根据B提供的知情信息以及处理目的信息,对数据进行 PlatON同态加密 ,将密文发送给B。此时,即使B将数据复制给其他人,由于同态加密的保护,无人可获知数据的含义信息。B完成处理以后,处理结果依然是密文。B需将结果密文以及处理计算过程的可验证证明发送给A,A根据证明的验证结果,对B的结果密文进行同态解密,将最终结果返回给B。整个过程中B从未得到过数据明文,且B提供的信息都是可验证的,这就确保了数据主体A的知情权、访问权、反对权、可携带权(迁移权)。
其次,由于A向B发送的数据采用了 PlatON同态加密 ,如果A需要对数据进行修改、更正,由于全过程数据明文B不可知,同时整个过程完成以后,B仅获得了与其相关的处理结果,全网仅A自己掌握数据明文,所以A可以在任何时候对数据进行更正、删除、限制访问,更正权、删除权、限制访问权便得到了保证。
最后,目前数据已被比喻成驱动AI的“石油”。AI模型的复杂性导致以人类的大脑,难以理解模型训练过程中数据操作的每个细节,而这恰恰是不受制于自动化决策权所要求的。采用 PlatON安全多方计算 基础设施,虽然无法保证用户能够知悉计算操作的每个细节,但是能够保证对用户数据的处理,或算法的执行,是由多方参与完成的行为,参与个体无法从自身所掌握的局部信息中获取到数据和计算的全局含义。这能够有效减轻用户的担忧,PlatON隐私计算提供的技术保证,能够有效提高用户明示同意的可能性。
确权数据才具备资产属性
资产是指企业过去的交易或事项形成的,由企业拥有或控制的, 预期会给企业带来经济利益的资源 。上文中提到,由于传统互联网无法确保数据主体的八大权利,想要确保所拥有的数据价值不被其他人窃取,就不能向任何人公开数据明文,但如此一来数据就难以挖掘出多样化的价值。同时,如果上文中A将数据交易给B,那么A就永远失去了对数据控制权,同时B也仅仅只能获取到该数据的使用价值,于是在传统互联网中,即使存在有关数据的交易,也只能是一次性的,且其价值非常低(因为可接近无成本的复制和多次交易)。党的十九大提出,要推动互联网、大数据、人工智能和实体经济深度融合,被誉为“石油”的数据将给我国企业发展带来新的机遇。然而因为缺乏技术保障手段,数据“石油”的价值,尚未真正凸显。
数据所有权与使用权的成功分离,是基本保障数据主体八大权利的前提,能够使数据在流转中具备多次交易的可行性,进而 使数据成为会带来经济利益的资源 。数据主体只要能够任何时候,保证数据明文在他人不可知的前提下,任由其进行数据的处理、转发、加工,且结果又仅数据主体可公布,那么就保证了数据所有权与使用权的分离。PlatON安全多方计算、同态加密、可验证计算提供了这样的技术保障。同时,PlatON本身作为一条去中心化的区块链公链,又提供了所有参与者进行去中心化数据流转的基础平台,这是 数据资产能够成功流转产生真正价值的重大机会 。
LAT:去中心化的数据确权流转能量媒介
数据资产的流转需要媒介,而PlatON的原生Token LAT 作为媒介 承担了数据和算力流通的清结算重任, 贯穿PlatON网络参与者数据流转的全生命周期。
同时,当发送LAT和使用PlatON应用程序时,必然会消耗一定的能量,该消耗主要用于激励节点处理和验证交易,以及链上智能合约的执行。PlatON上每个应用的运行都要消耗一定的资源(包括算力、带宽、存储、数据等)。而链上资源是由参与节点共同提供,为实现资源的公平使用,避免资源的滥用,PlatON通过一系列算法实现资源的合理调度和有效性验证,并 使用LAT来度量资源的消耗 。因此,LAT也是驱动PlatON这个“计算工厂”运算的能量。
最后,在PPOS机制中,LAT对网络非常重要。 LAT用来委托节点 ,或者自己质押成为验证节点,以此维护PlatON网络安全并获得LAT奖励。
结语
PlatON隐私AI计算网络是集体的科学探索与智慧融合,能够在技术层面、组织层面、安全层面,全方位支撑数据确权资产化、数据全生命周期流转,伴随蓬勃发展的生态,相信能够在数字经济时代发挥越来越显著的作用, 开拓世界是所有PlatONer的共识凝聚,我们在努力践行!
参考文献:
[1]欧盟《通用数据保护条例》.https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32016R0679&from=en