人工智能时代的隐私保护 — PlatON 2.0白皮书解读

皓蓝BlueOrigin · 2021 年10 月 9 日 06:33

撰稿人：M6

以下内容为个人观点，并不代表投资建议。

喜欢的朋友，请一键三连，点赞、评论、分享！

在这个时代，人工智能对于大家来说并不陌生。人工智能促成了现代技术的许多突破，作为新一轮科技革命和产业变革的核心力量，促进社会生产力的整体跃升，推动传统产业升级换代，驱动了“无人经济”快速发展。

人工智能从诞生以来，理论和技术日益成熟，应用领域也不断扩大，可以设想，未来人工智能带来的科技产品，将会是人类智慧的“容器”。人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能，但能像人那样思考、也可能超过人的智能。

在过去5到10年，互联网、移动互联网、物联网的强势发展产生了海量的数据，芯片处理能力提升、云服务普及以及硬件价格下降也使得计算力大幅提升，加上广阔的产业及解决方案市场使得人工智能技术得以快速发展，AI早已无处不出现在人类的日常生活中，从行业来看，人工智能已经在医疗，健康，金融，教育，安防等多个垂直领域得到应用。

全球范围内越来越多的政府和企业组织逐渐认识到人工智能在经济和战略上的重要性，并从国家战略和商业活动上涉足人工智能，普华永道关于到 2030 年人工智能对世界经济的经济影响的研究报告称，到2030年人工智能的出现将为全球GDP带来额外14%的提升，相当于15.7万亿美元的增长，超过中国和印度目前的国内生产总值总和。全球人工智能市场将在未来几年经历现象级的增长。

德勤在其2019全球人工智能发展白皮书中推算，我们预测未来 2025年世界人工智能市场将超过6万亿美元，2017-2025年复合增长率达30%。在主流人工智能领域，深度学习（Deep Learning）近年来取得了突破性进展，再次点燃了人们对“类人”AI的希望之火。

前几年谷歌AlphaGO与人类的挑战赛成了当时的热门话题，同时也是人工智能的一个标志性事件。几年之后波士顿动力公司（Boston Dynamics）在YouTube发布了他们新一款的机器人Spot，4200万人观看过这段视频，再加上国内视频的转发，观看量可想而知。

很多人工智能爱好者都视它为人工智能行业的杰出代表。Spot使用人工智能来可视化其周围环境。这意味着用户可以将机器人指向任何方向，而机器人可以优化每个动作来决定朝目的地移动的最佳动作。传感器检测障碍物，以告知是否有要爬的岩石或要避开的墙壁。动作如此精确，以至于它的四只腿可以弹跳。更惊讶的是，如果机器人接受挑战使其摔倒，它可以通过一系列已知的动作恢复自身。

2019年9月，波士顿动力公司正式宣布Spot机器人以租赁的方式投放市场，2020年2月，波士顿动力的四足机器狗Spot正式“出海”，入职挪威石油公司Aker，成为该石油公司第一台拥有员工编号的机器，他帮助检查故障、检测碳氢化合物泄漏、收集数据并生成了报告。

不仅如此，Spot还成为了一名新晋矿工，它进入世界上最深的基德克里克矿，深入矿区进行安检，保护工作人员，让他们远离潜在危险。无论什么样的矿区地形，它都能轻松驾驭。

在建筑施工领域Spot配备激光扫描仪并编程常规扫描路线，以收集有关施工进度的高精度 3D 数据。远程测量现场的关键区域，并将竣工条件与设计意图进行比较，以及早发现问题并最大限度地减少返工。

目前的Spot硬件方面其实已经趋于成熟，最难的就是算法，从机器人设计来看，每一种动作背后是一个算法，像是走路、跳跃等，要把各种算法与软件结合，进而协调四足自由度的运作，而波士顿动力公司的机器人之所以能各种秀操作，人工智能在其中扮演了关键角色。

当人工智能算法更进一步、更广泛、更深入的被融合到机器人系统中，接下来会发生的事，不再只是靠新开发的一套算法去教会机器人新动作，而是要让机器人在未来能做到自己遇到新的环境时，会发展出对应环境需求的新动作。可以想象这样的跃进发展会对机器人带来非常大的变革。

尽管Spot还有许多问题有待完善，但这个项目是目前结合了人工智能的机器人技术最成功的应用。它向我们展示了人工智能的无限可能。

目前以深度学习为主的机器学习技术离不开海量的数据进行学习和推断，因此海量的数据成为人工智能前沿技术发展最重要的资源之一。科技巨头们通过互联网发展期的积累，获得了海量的数据，随着数据的值在人工智能时代日益凸显，这些数据也将逐渐演变成企业的重要资产和竞争力。据IDC估算，全球数据总量预计2020年将达到44ZB，中国的数据量将占全球数据总量的18%，在2020年达到8060EB（约等于7.9ZB）。

人工智能从1956年概念确立至今，已走过了60余年时间。为什么过去几十年人工智能都没有火起来，直到近几年才开始真正爆发。

最重要的两个影响因素是：数据和算法。

在第三次人工智能浪潮之前，传统人工智能因受算力和数据量的限制，并没有表现出明显的“智能”特征，也未能满足实际应用需求。其间经历了20世纪50—60年代人工智能浪潮期，也经历过70—80年代的沉寂期。

直到2006年，Hinton教授提出“深度学习”（Deep Learning）神经网络使得人工智能性能获得突破性进展，这一次的人工智能浪潮与前两次的浪潮有着明显的不同。基于大数据和强大计算能力的机器学习算法已经在计算机视觉、语音识别、自然语言处理等一系列领域中取得了突破性的进展，基于人工智能技术的应用也已经开始成熟。让人工智能开始真正迈向“智能”和落地应用。

人工智能越是“智能”，就越需要获取、存储、分析更多的个人信息数据，不可避免会涉及个人隐私保护这一重要伦理问题。今天，各类数据信息采集无时不有、无处不在，几乎每个人都被置于数字化空间之中，个人隐私极易以数据的形式被存储、复制、传播，如个人身份信息数据、网络行为轨迹数据以及对数据处理分析形成的偏好信息、预测信息等。可以预见，在不远的未来，越来越多的人工智能产品将走进千家万户，在给人们生活带来便利的同时，也会轻易获取更多有关个人隐私的数据信息。

而当我们为人工智能的曙光到来欢呼时，也应意识到人工智能的发展也再次遇到了以下几个问题：

| 隐私泄露

早在1993年刊登的一则由彼得·施泰纳（Peter Steiner）创作的漫画标题而变得流行“在互联网上，没人知道你是一条狗” 这则漫画体现了一种对互联网的理解，强调用户能够以一种不透露个人信息的方式来发送或接受信息的能力。

但随着人工智能技术的快速发展及其在金融、交通、商业、医疗等领域的广泛应用，大数据中蕴含的价值不断被开发，产生了巨大的经济效益和社会效益。大数据逐渐改变着人们的生活生产方式。但与此同时，人们对大数据决策产生深度依赖，对自身数据失去掌控权，加上人工智能极大地增强了隐私入侵的能力，带来了更多的隐私获取性；用户数据的滥用问题、隐私泄露问题层出不穷。

我们每个人的手机号、电子邮箱、家庭地址和公司地址经纬度坐标、手机识别码、消费记录、APP使用记录、上网浏览记录、搜索引擎结果的点击习惯、刷脸记录、指纹、心跳等等这些信息都是我们不愿意轻易给出的隐私数据，但在人工智能时代，这很可能已经成为某个公司用来训练AI算法的数据集中的一条。

正是众多不起眼的一条条个人隐私数据，构成了足够多的训练集，让AI从中学习到认知能力，让从未跟我们谋面的AI算法认识、了解我们，知道我们的喜好和动机，甚至还认识我们的家人、朋友。我们的隐私便是实现这些智能的“代价”。

PlatON的隐私保护，基于MPC、同态、零知识证明等现代密码学的隐私计算技术，提供了计算的全新范式，使数据和模型可用而不可见，让隐私得以完备的保护，数据权利得以保障之下仍然能实现数据的联合建模和价值分享。

| 人工智能发展背后的巨额成本

苹果，亚马逊，Alphabet，微软和Facebook等科技巨头投入巨资到通用人工智能研发上，谷歌2014年花费5.4亿美元收购DeepMind，微软2019年向 OpenAI 投资10亿美元，根据西雅图研究公司Mind Commerce的通用人工智能报告，到2023年通用人工智能的相关投资将达到500亿美元。

人工智能模型训练成本

数据成本

人工智能学习需要数据集的获得、数据的标注等，其中数据的标注会造成巨大的人力成本。广泛应用深度学习网络需要大量已标注的数据进行训练才有可能达到预期的效果，但大数据时代下，虽然有海量的数据取之不尽，绝大部分却是未进行标注的数据，这些训练数据的标注需要人为进行。

此外，检查和校正数据样本与生成和注释数据样本一样耗时。Dimensional Research 研究报告中提到，66％的公司在其数据集中遇到偏差和错误问题。有些公司选择采用完整的内部方法（自己做所有标注），也有一些公司会选择外包和内部混合使用。第二种常见的情况是将大部分工作外包，然后由个别人员负责验证和清理。

算法成本

行业的发展同时意味着行业人才的涌入，人工智能的快速发展也让人工智能工程师变得炙手可热。“AI算法工程师=高薪”这是大众认知的事实。算法成本根据复杂度、算法难度、要求的高度等，如果是谷歌、阿里、华为去做这一件事情，投入最少也是几千万美元以上。

阿里AI Labs年薪百万美元引进两位科学家

2019年9月，各大互联招聘企业陆续发布2019年人才就业趋势报告，其中AI人才以平均月薪位居榜首。

数据提供：猎聘大数据研究院

算力成本

虽然说近几年算力成本有所下降，但基础设施本来就是一项耗资巨大的。训练一个AI模型就可能需要数十万美元甚至更多的计算资源。而且由于馈送Al模型的数据会随着时间变化(即数据漂移），重新训练还会带来持续成本。模型推断在计算上也更加复杂.Al经常涉及图像、音频或视频等数据，需要更高的存储资源和处理成本。对—些公司来说，Al模型必须在区域云之间进行转移，云计算操作就更复杂，成本更高。

| 数据垄断

虽然AI取得了巨大的进步，但AI的好处并没有得到广泛利用，人工智能还没有实现民主化，而且有愈加集中的趋势。大多数人工智能研究由少数科技巨头控制，人工智能的独立开发者没有现成的方法来变现他们的成果。通常情况下，他们最有利可图的选择是将他们的技术卖给科技巨头之一，导致技术控制变得更加集中。

少数科技巨头们通过为消费者提供服务垄断了数据上游，获得前所未有的数据，训练高端AI模型并纳入他们的生态系统，进一步增加用户和其他公司对科技巨头的依赖。除少数科技巨头外，小型企业、创新企业等其他市场主体很难收集大规模的数据，即使花费了不菲的代价获得了数据，也缺乏有效的使用场景，并且无法交换，很难精准的对接相关的AI学习网络。

大多数组织都面临着AI技能和人工智能人才的缺乏，而科技巨头正在战略性地致力于以前所未有的速度和规模垄断AI人才，进一步拉大与其他公司的差距。

有人曾说：“数据是新时代的石油”。事实上伴随物联网、大数据、深度学习等技术的发展,一个”万物互联、人人在线、事事算法”的人工智能时代，数据的价值早已超过了石油。数据是人工智能的基础,算法是人工智能的本质,人工智能越智能就越依赖数据的喂养和算法的支持,数据的积累越来越多，数据的增长速度越来越快，却出现了越来越多的人工智能企业无数据可用，越来越多的优秀算法无数据可训练的奇怪现象。

一方面因为：随着数据价值的凸显和数据泄露事件的频发，从个人到政府对数据主权和数据隐私保护意识日渐增强，企业不能再像之前一样肆无忌惮地采集和利用用户数据。

另一方面：各企业也日益将数据视为各自的核心资产，在数据主权和隐私不能被有效保护的前提下，无论是从维护自身利益角度还是从遵守法律法规角度，都不愿将自身数据进行共享利用。

| 对环境的影响

人工智能经常被比作石油行业，一旦对数据进行开采、精炼，就可以变为高利润的商品。现在看来，人工智能在能耗层面的表现也可与石油行业一较高下。根据最新的论文结果，训练一个 AI 模型产生的能耗多达五辆普通汽车寿命周期排放的碳总量。

这一结果也是很多 AI 研究人员没有想到的。西班牙拉科鲁尼亚大学的一位计算机科学家表示：“虽然我们中的很多人对此(能耗)有一个抽象的、模糊的概念，但这些数字表明事实比我们想象得要严重。我或者是其他 AI 研究人员可能都没想过这对环境的影响如此之大。”

此外，研究人员指出，这些数字仅仅是基础，因为培训单一模型所需要的工作还是比较少的，大部分研究人员实践中会从头开发新模型或者为现有模型更改数据集，这都需要更多时间培训和调整，换言之，这会产生更高的能耗。

这样高昂的价格使想要解决新问题或自动化其流程和决策的个人、小型团队和初创企业无法使承担，从而导致几乎死锁。

PlatON综合使用了区块链、隐私计算和人工智能技术，致力于解决人工智能发展的瓶颈。促进数据的合规流通，打破数据垄断，通过去中心化累积比科技巨头的数量更多，质量更好，成本更低的数据。

1、去中心化
任何用户、节点无需都可以连接到网络，结合去中心化数字身份（DID）认证和授权，全球范围内任何数据、算法和算力进行安全的共享，连接和交易，人人可开发和使用人工智能。

2、隐私保护
基于MPC、同态、零知识证明等现代密码学的隐私计算技术，提供了计算的全新范式，使数据和模型可用而不可见，让隐私得以完备的保护，数据权利得以保障。

3、高性能共
通过Pipeline验证、并行验证、聚合签名等优化，实现高性能异步BFT共识，并使用形式化验证方法证明其安全性、活性和快速响应性。

4、低训练成本

任何人都能够在安全且无摩擦的市场中共享计算资源，真正降低边际成本，大幅度地降低社会的计算成本。
实现安全的数据共享，促进数据的合规流通，打破数据垄断，通过去中心化累积比科技巨头的数量更多，质量更好，成本更低的数据。

5、低开发门槛

可视化AI模型开发及调试，自动化机器学习（AutoML），通过MLOps简化AI模型从模型开发、训练到部署的全流程管理流程，降低AI模型的开发门槛，提高开发效率。AI服务能自动发现、组合、协作，通过更高级的自动编程形式，创建越来越多的创新AI服务。

6、监管合规
AI训练决策过程中使用的所有数据、变量和过程都有不可篡改的记录，可进行跟踪和审核。隐私保护技术的使用使得数据的使用满足被遗忘权、可携带权、有条件授权和最小化采集等监管条例。

蒸汽时代的煤矿、电气时代的电力、科技时代的计算机技术，每个时代都有推动它前进的引擎。未来基于区块链的去中心化隐私人工智能网络，将成为推动人工智能时代前进的引擎。

人工智能既是现在，也是未来，它不再是电影中的影像和概念。无论有多少人理解或不理解，AI都将革命性地改变创造AI的人类自身；至于未来，没有人知道会如何，真如Matrix中的情节一样？人类最终被机器所篡养？我们不得而知；但有一点是肯定的，人类孜孜以求的研究和发展，这个时代终将会到来。

PlatONWorld — PlatON生态长期主义者的基地！

欢迎大家持续关注 PlatONWorld !

PlatONWorld | 官网 platonworld.org

PlatONWorld | Telegram

PlatONWorld | 微信社区 mcqueen678（微信号）

BoneyBee68 · 2021 年10 月 9 日 08:24