1 全数字时代的智能化与隐私安全
作为数字经济时代最具价值的核心生产要素,数据已经成为国际基础性战略资源,对国家治理能力、经济运行机制、社会生活方式产生深远影响。
预计到2025年,全球联网设备将达到309亿台,联网设备及其服务创造极其庞大的数据规模,其中用户行为数据的规模与日俱增。IDC预测到2025年,全球数据将会拓展至163ZB(即163万亿GB),相当于2016年全年产生数据的十倍。
图1 全球数据增长趋势
数据来源的多样化、数据形态的异构化、数据规模的海量化将给用户带来全新的交互体验,并且产生更多商业机会。数据已然成为链接消费者、生产者和政府之间的运作要素。
上一个十年,我们从模拟时代进入数字时代,社会的变革看得见、摸得着。我们相信下一个十年,数据的力量能够给我们带来无限的想象空间。
十年前,2011年。移动互联网刚刚兴起,以Apple、Samsung为代表的移动终端设备提供商和以Alibaba、Tencent、Facebook、Google为代表的移动互联网服务提供商,它们的加速迭代,使得移动互联网较之传统的桌面互联网,打破了既有的时空边界[2],使得人机交互更加方便的同时,也带来更多数据风险。
但不可否认,在全数字时代的浪潮中,移动互联网作为排头兵和先驱者,从微观个体层面的社会交往、中观群体层面的社会表达、宏观结构层面的社会分化等多个维度塑造了当前数字时代的基本面貌。这种塑造的本质,其根源是终端设备的移动性和便携性,当然也正是因为这两种性质,使得人们随时能够接入互联网,拓宽时空边界的同时,也极大限度地占用了人们的时间。而长时间地使用,意味着数据的持续产生。
以抖音、快手为头部的短视频应用,把人们的时间切割成一个又一个的零碎片段;微信、QQ作为社交类应用的巨头,将人和人之间的距离不断拉近,借以实时语音、视频通话打破物理空间的界限,随时随地都能社交;滴滴、优步采取强力算法,让用户在任何时刻都能畅享出行便利;美团、饿了么以系统优势,让人足不出户就能享受美食……
移动互联网的魅力在于服务,用户只需要手指头轻轻几下,在产生数据的同时,可以享受到快捷服务的便利。这是模拟时代所无法比拟的优势,在全数字时代下,数据以二进制的形式在世界上的任何一个角落产生,汇流到中心化的计算平台,而平台使用各类算法,分析、处理、计算这些结构化、半结构化、异构化的数据,最终反馈给用户优质的结果,增强用户对平台的使用黏性,在一次又一次的正向反馈中,强化平台影响力。
用户的数据,尤其是行为数据在不断地产生,地理位置、喜爱偏好等隐私信息也在这个过程中被平台收集、掌握,最终摇身一变成为平台牟利的工具。用户在充当消费者的同时,也扮演着生产者的角色。
在移动互联网时代浪潮里,人工智能和数据安全开始显露峥嵘,未来十年,随着数据量爆发式增长,它们将成为炙手可热的关键赛道。
1.1 人工智能
人工智能从事后回溯走向事前决策。 随着数据规模逐渐增大,机器学习、自然语言处理等人工智能领域内的数据分析方法逐渐从事后分析转变为事前的战略决策和行动的极极驱动力。通过人工智能系统模拟人类在某种情况下的响应和行为提高各行业、环境和应用数据分析的频率、灵活性和即时性。
图2 人工智能领域细分
1.2 数据安全
数据安全是重要基础 。用户在享受服务的同时,也在为服务的迭代创造新的养料。不同的服务提供商毫不节制地向用户索取隐私敏感信息,甚至某些平台将用户敏感信息明文存放在没有妥善保护的数据库中。当服务架构的某一环出现异常时,随之而来的漏洞会给用户数据造成不可挽回的重大风险。
数据安全还包括大数据安全,这个含义则十分宽泛,用户面临的威胁不仅是个人隐私泄露,在数据全生命周期中,例如存储、处理、传输等过程里同样面临着许多安全风险,具有数据安全和隐私保护的需要[3]。可正是因为在大数据的背景下,服务提供商不仅是索取用户数据的汲取者,同时还控制着用户数据的存储、处理、传输,等同于是身兼多职。所以,用户如果只采用针对云计算平台的技术策略限制部分垄断性服务提供商对其数据的使用,是极其困难的。
因此,我们迫切地需要一个分布式的可信隐私保护平台,它可以为用户提供切实可行的隐私保护手段,从根本上解决全球数据治理难题。
今天的数据是与日俱增的指数型,有越来越多的数据需要安全保护,但是实际上得到妥善保管的数据很少,两者存在明显差距,并且随着时间的推延,这一差距将会持续扩大。直到2025年,全球数据中有接近90%的数据需要某种程度的安全保护,但具备这一条件的数据还不到一半。可以见得,隐私保护这一赛道有着巨大的潜力。
2 网络智能化
从Web诞生之后,人与人之间的距离越发的靠近,从早期的信息连接,通常是机器底层的联系,比如说搜索引擎、网站黄页、数据库或者是文件传输服务等,这些属于将信息以二进制编码的信息通过网络协议传递给用户,这是属于早期的Web1.0时代。
到1999年以后,以人为核心的Web2.0时代正式来临,各种社交平台层出不穷,UGC也在不断地为平台带来机遇和挑战。大规模人类网络协同作业,在线的云办公或者是云会议变得稀松平常,但这往往是集中式的软件服务,庞大的平台方利用早期优势抢占用户高地,试图以用户捆绑用户的形式,巩固它的垄断地位。而这就对用户的隐私问题以及平台的安全性做出了严峻的考验。
下一代的网络,我们把它称作是Web3.0,当下还没有很明确的定义,但我认为3.0时代的Web,应该是以知识为核心的分布式网络。人们能够在任何时间、任何地点和任何人、物进行对接,产生一定的联系;同时,Web3.0还将在当下的AI领域中取得一定的技术进步,以自然语言处理算法为基石,加之以妥善可靠的密码学技术,让用户能够以类人类的方式向网络下达智能化指令,由此可见,Web3.0时代也是通往AGI的进化路径;随着Web的发展,用户的身份和数据应当妥善的被自我管理、掌握,甚至是出售或者在没有第三方的情况作出交换。
PlatON在这里是将个人的数据序列化,提取出其中可以计算的部分,依靠先进的密码学算法对用户数据进行加密,确保用户在出售和交换双方数据时不会失去所有权以及个人隐私。总的来说,Web3.0应该满足这四点主要特征:无处不在的连接、语义网络、智能网络、自我主权。
当然也可以畅想看看WebX.0时代又将是什么样子的?而那可能就是人类探索的终极奥秘。
PlatON 2.0
PlatON结合区块链和隐私计算技术,建立一个去中心化的协作式隐私人工智能网络和全球大脑,以推动人工智能的民主化并建立安全的通用人工智能。
从字面上看,区块链和隐私计算是有一定联系的,前者追求的是去中心化、匿名化、公开透明;后者追求的是保护用户的隐私信息,换句话说叫做“可算不可见”。那么就跟区块链的去中心化和匿名形成了较强的联系,但是着实算不上公开透明。
但往更深层次来讲,公开透明是存在的,用户拿出了自己的信息,通过加密的手段把密文完全的公开,利用现有的加密手段给予处理,是完全能够获取所需要的模型养料。
那么PlatON实现自己的使命,达到既定的目标,提出了三步走战略方针:
首先建立一个去中心化的数据共享和隐私计算基础网络,连接数据所有者、数据使用者、算法开发者和算力提供者。
接着实现人工智能市场的去中心化,将AI资产的共建共享、敏捷应用开发完全的上网上链。我们应该明白的是,AI领域在开发的过程中不光光是算力,还需要考虑到算法的优劣、数据集的多寡,最后能否落地,这些统统是AI软件服务商需要去考虑的。现在有了PlatON,从算法、算力、AI的能力提升还有最后的生产、部署、集成等全流程作业都可以轻松搞定,这是PlatON的优势所在。
最后构建起去中心化的AI协作网络,实现AI之间的大规模合作,以数量的优势进行群体智能计算来执行最终的复杂AI服务。
这最后一点,我展开说说。在AI算法领域里有个子集,叫做群智能优化,顾名思义就是有些东西它单打独斗的时候搞不赢人家,但是一旦群体出动,那就是惊天动地啊!比如说蜂群、蚁群或者是狮群。去中心化的协同AI网络,正好跟未来的WebX.0时代有着异曲同工之妙,是以AI连接AI,进行优势互补,克服双方的短板。