随着大数据时代的到来,隐私泄露问题逐渐显露出来。越来越多公民的个人信息被记录和利用,隐私成了“皇帝的新衣”。但试想一下,这是经过同意的结果吗?当注册App时需要获取网络授权、定位授权、通讯录授权,大家有想过拒绝吗?
立足于此,PlatON创始人孙立林先生接受「造就」邀请,发表《一切皆可计算》的主题演讲,对数据、计算、算法、企业、个人之间的微妙关系做了一场精彩解读,并提出一套极具启发性的解决方案。
以下是全部演讲内容:
欢迎大家来到算法世界。
在过去的十五年里,从互联网到移动互联网的发展,涌现了一些新名词: “云计算”让大家注意到“计算”;“大数据”让大家开始关心“数据”;在过去的两三年里,AI让大家开始关心“算法”。
今天我们就来捋一捋计算、算法、数据这几者之间的关系。
让我们先从哲学开始谈起。
一、计算的历史
1. 计算与哲学
左边这张图是伟大的哲学家、数学家莱布尼茨的一张手稿。
他几乎和牛顿同时发明了微积分,虽然后来大家听到微积分时想到的都是牛顿,但我们用的微积分符号其实是莱布尼茨发明的。 他是理性主义的旗手,也是把“计算”这个问题直接摆到哲学高度的第一人。
右边这张图是莱布尼茨设计的计算器,今天在德国的博物馆里还保留着他当年的设计手稿,非常精巧。在他早期一部非常重要的形而上思想著作《论万物的终极根源》当中,他说了这样一句话:世界不仅是一台最值得称道的机器,而且就其心灵组成而言,也是一个最好的共和国。
作为虔诚的信徒,他的本意是想论证上帝是万物存在的此在,是一切存在的造物者,但他很不经意地,或者也许是刻意地,给出了计算的源头。 机器是计算的载体和工具,但本源来自于计算。
这张图很有意思,这是中世纪的法国画家画的,他画的是上帝拿着尺规在创世,这是我们人间。这句话是莱布尼茨写在他一本数学著作里的批注: 当上帝完成计算和审核之后,世界才被创造出来。
是不是很熟悉?这就像今天的程序员一样,当你完成了代码编写和调试之后,这个数字世界才被创造出来。
这是人类对计算最原初的理解,它开启了一个伟大的时代, 世界不仅是台机器,而且是一个心灵的共和国。
2. 计算与数学
接着,我们来看看计算与数学的关系。
整个计算的历史,可以追溯到人类早期,它和数学的关系非常密切,算法的本质也是数学。
人类早期为了感知世界如何运转变化,需要测量尼罗河的河水什么时候涨,什么时候落,需要了解太阳和月亮运行的轨迹,需要测量自己种的这片地的大小和边界。
所以, 人类的整个生存史是从计算开始的。
这里罗列了很多伟大的数学家以及哲学家,从笛卡尔到莱布尼茨、布尔、弗雷格、罗素和哥德尔……
笛卡尔提出了坐标系;布尔,我们学到的布尔代数、逻辑运算是布尔提出来的;弗雷格,也是逻辑数学上一个伟大的哲学家;罗素,通常大家会认为他是哲学家,大家看过他的《西方哲学史》,实际上他也是一位伟大的数学家;还有哥德尔,提出了不完全的证明定理……
莱布尼茨在三百年前就提出了“ 让一切皆可推理和计算 ”,今天我们孜孜以求的人工智能、大数据和云计算,仍然在延续着这个哲学家的伟大梦想。
二、算法世界的计算架构和基础设施
科学家对算法有明确的定义:在有限的时间里,必须有明确的输入和明确的输出,否则即不可计算。
那么计算和算法的关系是什么?
1. 计算与算法
这是我们设想的下一代的计算架构:
大家最近可能经常听到“区块链”,我们试图做的下一代计算架构里面,区块链只是其中很小的一部分,还包含了其它的很多算法:安全多方计算、可验证计算等等。
这个架构很重要的一件事情是把计算,作为一个基础设施,从共识当中剥离出来。让大家真的看到,计算是可以作为基础设施单独存在的,计算可以在架构里面发挥巨大价值。
这是我们对基于计算给出的最新概念——基于计算的智能合约(一般意义上的智能合约,并不是普适性的)。我们给出了两个重要的计算概念,一个叫合约计算化,一个叫计算合约化,在这里大家可以看计算、算法、数据和算力的关系:
作为一个发起交易的人,左边这个Client,他实际上是一个计算需求的发起者,这是其中一个角色;上方的合约开发者,他实际上是算法提供者(智能合约也是一个算法);右下角有算力提供方、数据提供方,我们已经把它分成了好多种; 中间生成的智能合约,其实就是一个算法空间。
算法交由哪里执行?合约执行环境怎么来隐喻和类比这件事情?我们想了一个也许不那么恰当的比方——
数据就是这个时代的原材料;
算法是这个时代的流水线(它和工业时代西门子公司造机器没有本质的区别),要有明确的输入和输出,要明确地制造出产品;
算力是这个时代的能源和动力,可以类比的是拉磨的马,驱动整个流水线的蒸汽机或电力;
合约执行环境就是工厂,是一个计算工厂。
这是我们明确提出的一个新的理念,我们希望构造的计算基础设施就是这样一个计算工厂。
这个时代新的虚拟工厂,里面需要包含的逻辑和角色,有数据提供方、算力提供方、算法提供方和需求发起方,大家在一个工厂里构成了这个世界真正的基础设施。
当然,我们需要解决的问题非常复杂——计算的性能是否足够?我们真的能做到并行计算吗?是否真的能够保障大家的隐私?
2. 计算和隐私
大家都知道,这一代互联网是做不到隐私保护的。譬如,Facebook发生的严重的数据泄露,不管在理论上、法律上或道德尺度上,这个情况都是我们无法接受的。
所以,下一个我们要探讨的,就是计算和隐私的关系。
基于下一代计算架构的算法世界与隐私之间的关系,存在以下三个“矛盾”(在这里“矛盾”是一个中性词,不是一个负面的词,因为矛盾是客观存在的)。
第一,个体隐私和中心监管之间的基本矛盾。 也就是说,我们所有的交易数据,事实上是都要接受监管的,包括我们的身份和处理的整个流程。
第二,交易隐私和登记确权之间的矛盾 。这个特别有意思,今天我们在电商、在社交网络,包括你买股票,在所有的交易场合,其实 大家的隐私是没有得到真正意义上的保护的。
也就是说,这一代的互联网公司,事实上构造了一个巨大的交易平台,而我们每一个人7×24小时,365天,5年、10年、20年……不间断地在无偿为他们贡献数据以及详细的交易流水,帮助他们获取巨量的数据和高额的利润。
那么这个矛盾如何解决呢?我认为,未来在所有的电商和社交平台上—— 我们提交的数据应该被加密;所有的互联网公司要使用这些数据,必须要征得人们的同意;如果他们在商业或者其他方面有所收益,理论上应该和我们一起分享。这是下一代计算架构必须致力解决的问题。
第三,数据隐私与数据归集之间的矛盾。 这个更有意思,今天我们格外在意数据的主权,每个人都觉得这数据是我的,可是一旦你和这个世界发生关系,你的数据就会被别人调用。如何在数据没有被复制的情况下,大家仍然能够一起计算?
这就是数据隐私和数据归集的矛盾。每个人都不希望自己的数据被他人拿走,但是我们身处在这样一个世界,仍然 需要大家一起同心协力、共同计算,所以实现安全多方计算,非常重要。
三、一切皆可计算
1. 计算与“人”
下一个命题是计算与“人”。我特意打了一个引号,这个人是完备意义的,哲学意义的,或者生命意义上的人。
前一段时间,就在这个舞台上,「造就」请到了《原则》这本书的作者Ray Dalio,桥水基金的创始人来演讲,他提了一个非常好的观点: 痛苦+反思=进化。
这其实也是一个算法和计算的过程。我们在探索这个世界的时候,会有很多种不同的实验方法,它可能是下意识的,也可能有明确的目标和计划,但一定会遇到挫折和失败。“经过反思”,就类似于算法做了一次调整和重构,于是我们的生命和选择就得到了进化,这是人类发展的一个基本原则和基本前进路线。
在这里计算到底能发挥什么样的价值?
先解释一下, 我们生活的这个数字化世界里边,其实到处充斥着代理人。
打个比方,大家如果去买一杯咖啡,无论你今天是用支付宝微信扫码,还是刷银行卡,本质上卖咖啡的商户和你之间是没有信任关系的,他信任的是你背后的银行或者是支付机构。
因为无法确认你是否能够付得起这笔钱,所以需要做交易确认,当然,所有的风险是由你背后提供信任的机构来担保的。所以商户信任的,是为我们每个人做背书的机构的信用,而不是我们的信用。而这些被信任的金融机构,给我们足够的信用额度,Credit,这是这个时代充斥代理人的基本原因。无论你是做消费还是投资理财,统统都是这样进行的,有大量的中介替我们来完成数字化的交易。
但是在真正的算法世界,或者说下一代的计算架构里面,我们认为算法本身就可以提供足够的信任,计算过程包括认证环节,进行一次交易不需要你重复被认证。
这是我们希望看到的: 通过计算和算法重构交易流程,把更多的工作交给底层的基础协议站来解决,交给计算工厂,交给算法世界,让人们之间的关系变得更直接简单。
这是我女儿11岁的时候画的两张画。她画的是两首诗,左边是《江城子·十年生死两茫茫》,右边是《蝴蝶泉》。
春节期间,我送她去了一个记忆培训班做了四天培训,她学到的方法,让她半个小时内,从5个单词都记不全,到能记住88个单词。她的同龄人速度最快的可以记到340个单词,从发音到中文意思到英文拼写,准确记忆。这个方法也用在了她的古诗词的学习上面。
实际上这个方法是在构造一套通用、全新的符号,无论你是学习英文、中文、数学,还是学习物理、化学,把内容符号化之后,加速人的记忆。
当然她的这个“算法”还是有待优化的,她左下方画的是一个在哭的人,这个部分的形式化和符号化程度做得还不够,也许下一次,这个“算法”迭代进化的时候,她的抽象化程度可以做得更高。
当一个人形成一套属于自己的完备的形式化和符号化的工具以后,他就可以屡试不爽,百战百胜。 无论你给他看的是一幅随机的扑克牌,还是一篇新的散文,还是一部《韦氏词典》,他都可以在规定时间里边,把这个明确的输入,给成一个明确的输出。输入什么呢?就是这些符号化的东西,在她的大脑里面翻译回来,变成大家熟悉的“十年生死两茫茫”。
这件事情给了我特别震撼的启发,谁说人不是机器呢?
2. 计算主义
这是另外一个词,在最近这十多年,有一个新的提法叫“计算主义”,甚至有一位宇宙物理学家提出来:宇宙的本质是数学。其实这个观点一点都不新鲜,古希腊伟大的哲学家和数学家毕达哥拉斯就曾经提出“万物皆数”;伽利略也说过,这个世界是由数字和数学组成的……
但是计算主义是否真的能够代表世界的真相?也有很多人不认可它,很多人认为这个世界是经验主义的,是人文主义的,人要“诗意地栖居”。所以下面这句话,实际上是我的一个有意的解读: “技术地栖居” 。
计算或者计算主义,在我今天来看,就是人类“技术地栖居”的基本方式。我们从出门赶到「造就」的现场来参加这次活动,大家需要导航,需要打电话联系,需要找停车场,需要找座位,需要跟你的朋友打招呼,所有的行为都是计算出来的,无论是用我们的脑细胞来算,还是通过你的手机或车载导航来算。
大家可以发现,我们生命的每时每刻都在主动或者被动地计算。
而数据或者算法是由计算这个过程来承载的,那么算法和数据的关系,又是怎样的?
3、算法与数据
这里我们提到一个基本概念,叫全数字化世界的基本伦理。
在我们进入数字化世界之前,“伦理”多半是社会学范畴的概念,那么到了全数字化世界之后,是不是需要出现新的数据的伦理和算法的伦理?谁可以控制数据?谁可以控制算法?谁可以控制计算?
自然权利(指自然界生物普遍固有的权利,并不限由法律或信仰来赋予,且不为人类独有)是一个哲学上的基本概念,这里我提出来是“有关计算的”自然权利。在这个时代,在全数字化世界里面,我们每个人,拥有怎样基本的不可剥夺、不可篡改的自然权利?
这使我想到另外一个表述方式,计算和算计。
说起“计算”,大家通常想到的是Computer,计算机,或者计算器;说到“算计”,它通常被认为是一个负面的词,我们说这个人爱算计、小心眼、锱铢必较,但未尝不能把这个行为理解成是他的大脑在飞速地计算。
计算可以解决我们所有的问题吗?
大家都看过电影《非诚勿扰》吧,在故事最后,范伟扮演的角色被骗了,两百万英镑买了一个分歧终端机,两个人在里面比大小,划拳。我当时看的时候也是一笑而过。在我准备这次演讲的时候,我突然想到了那个镜头和那个看起来可笑的分歧终端机。
实际上今天我们所有的行为,人类之间的博弈,家庭关系,社会关系,职场关系,都可以被理解成为算计或者计算。我们期望的是,有了“计算”,不再“算计”——很多看似复杂的社会关系和人际关系,可以通过计算来解决,通过明确的数据输入和可以迭代进化的算法,经过计算得到明确的结果,让人和人之间的相处更加简单。
四、万物皆备于我
回归到“一切皆可计算”这个主题,我认为,“算法”和“计算”是一体两面,互为结果,它们就是“知”与“行”的关系。如果我们希望在全数字世界里面生存得更好、更有尊严,我们需要重视算法和计算,需要做到真正的知行合一。
这个世界需要有新的工具来帮助我们完成计算任务,这一点和我们早期驯化猪狗,我们发明其他工具没有本质区别。人类身为地球上最有智慧的生命,应该不停地发明新工具,掌握新工具。
有人担心人工智能将会替代人类,它会产生意识来奴隶我们。坦率地说,我对此观点秉持完全不认可的态度。
孟子曾说过:“万物皆备于我,反身而诚,乐莫大焉。”
人类在过去成千上万年里,就是通过不停发明新工具,改造我们生存环境从而进化到今天的,所以就算我们进入算法世界,启动下一代的计算架构,但天地万物间仍然有一个“我”。
“我”在哪儿?
日常里我们说的每一句话,背后都有一个“我”。比如我说“欢迎大家来到「造就」”,背后是“我”欢迎;说这杯咖啡很好喝,是“我”认为这杯咖啡很好喝,只不过在口语当中,我们下意识地忽略掉这个主语。
大家花点时间回想一下就会发现, 那个永恒的伟大的“我”,一直在我们的日常生活的背后发挥着所有的价值和判断。