从神经网络到智能奇点

Mapoet

2023年1月1日

犹记得上一次发关于Alpha Fold的链接是2021年4月份,一年半的时间医学界出现了很多新的蛋白质结构预测网络,而AlphaFold2也出世并解译了近两亿的已知蛋白结构。今天,人工智能的瓜吃到了我们自己的专业,仅依靠历史数据Pangu-weather的预报结果要比40多年潜心研究气候模式与同化模式的人群最新数值预报更优?不想谈具体技术,只是纯哲学上说下面的内容。

数据驱动下的神经网络从基本的前向反馈模型(BP)跨越到了深度学习、动态图、迁移学习等模式,使其相关的算法成为了如今机器学习算法中最具广泛的应用场景的工具。回想起初代机器学习,以自动化系统发展而来的专家系统主要基于决策树、自动推理系统等方式实现了专业知识图谱的分类与决策能力;以遥感数据分类、特征提取及特征增强发展而来的特征工程基于kmeans、meanshift、叠代自组织(ISODATA)、核评估聚类等聚类算法及支持向量机(SVM)等分类算法实现了机器学习中的监督及非监督分类,并最终结合机器视觉广泛应用于虚拟现实及增强现实方面;历史上也出现模拟退火法、遗传算法、遗传退火法等人工智能算法,但已经热度降低并渐冷落,被神经网络替代了其历史地位。神经网络基于全连接(DensNet)、卷积网络(Convolutional Neural Network, CNN),循环神经网络(Recurrent Neural Network,RNN)、长短时记忆网络(Long Short Term Memory Network, LSTM)、递归神经网络 (Recursive Neural Network, RNN)等模块,并结合池化、drop等技巧,形成了多层感知器(Multiple Layer Perception,MLP),AlexNet、ResNet、UNet、注意力模型(Attention Model,AM)、GAN监督增强等基本模块,不仅在数据编码、分类、特征增强方面取得显著成效,并结合生物化学(自动化有机靶结构实验平台,蛋白结构预测)、游戏策略(象棋、围棋及DOTA2)、天文及地学(宇宙结构演化,气象数值预报)等专业方面形成了落地成果,获得本行业专家对神经网络代表的深度学习能力与效率的认可。数据驱动与磅礴算力下的AlphaGo, AlphaZero, AlphaFold/-2系列的成果,让我们看到的只是经典神经网络带给人类财富与能力的冰山一角。

一位老师说:“人工智能,有多少‘智能’,就有多少‘人工’。有效的人工,才有智能。”想起人工智能的几次更迭,从拟神经元网络的提出(曾推特有人争论现代人工智能有多少受益于现代神经学的发展。许多人工智能大佬用着基础脑神经学的理论而非最新的研究成果来设计高效神经网络,但是他们还是坚持脑神经学会将继续指导他们的机器学习研究)受限于计算资源,到算力支持下的万能拟合器,再到如今数据驱动的应用涌现,但不会有任何人承认这就是我们最终追寻的那个人工智能—因为依托人工的智能但受限于人工所决定上限的人工智能并不智能,它只是卖油翁的唯手熟尔,与庄生所谓解牛斫轮者无异。很早就有人把这种人工智能称为弱人工智能。只有能够突破奇点,踏入自我正向发展状态才能创造知识—说得宗教气点,就是神创造的具有屠神并替代神的能力。这就是所谓的强人工智能。

封闭系统未来的可预知性,在于突破技巧与全信息的认识。我们坚信这一时刻宇宙的全信息包含了历史与未来,不然这个世界是不可知也不能理解的,比如宇宙可以看到所有“历史”;拥有所有信息的智慧体拥有所有必有用的历史,也将会识别所有的演化规律——这是智能的基础,但不能获得宇宙不同层级“物理”的信息也决定了奇点的存在——人类不能想象存在但是没见过的事物(我们可认知的物质仅占宇宙的4%)。信息的完备性是理想封闭系统可预报性的必要条件。气象模式中同化的意义在于不断吸收与原系统完全独立的成分而实现不断完备信息的过程(小的开放系统是大的封闭系统的子集)。采集信息的不完全性,导致没有理想封闭系统;而技巧是信息再加工的“科学”,不是新的知识—它是信息收集的过程,即熟能生巧的模式也会遇到科学范式的革命。

对于宇宙规律,我们期待简单但是不希望死寂。方法或者对数据加工可以实现对信息的整理与重利用,但是不是绝对与唯一的。同一封闭系统,存在不同的“科学”是可信也是可以理解的,但是它们总是可以规约于同一个框架,就是具有完全相同的“独立基”—一个封闭系统只有一种科学但是可以有多种表述。

对于真实存在,也远不是欧几里德共设可以完全描述。人类对世界认识中经历了生殖崇拜到自我崇拜(神学与美学),具形认知(朴素唯物主义)-具象认知(定性)-据量认知(定量),取得了如欧几里德共设、相对论与量子场论等伟大成就,但涌现、分形这两座大山依然横跨在我们理论与真实之间。基于第一性原理从底层复现上层物理过程,除过底层信息全面性难以保证,磅礴的算力与超高的精度也限制了逐步模拟上层物理规律的涌现过程。计算流体力学(CFD)等方法通过“假设简化模型”及“机器学习捕捉特征”来权衡“理论”对“现实”刻画精度,但复制尺度决定了功能尺度。分形学发现“基本规律”约束在元胞结构邻域可使用整个元胞信息网络呈现出复杂但自相似的结构,以之为原则来描述我们世界的“不同层级镶嵌结构”对于简化理论与现实之间的描述或更有力,如基于基本元胞结构及简单邻域条件,六度空间理论可呈现复杂网络结构,生命游戏生成复杂演变过程,人脑神经元结构实现状态控制决策。这种框架推动了元胞自动机、自组织结构相关的研究与应用,而这种框架如何更好地结合信息动态信息输入形成元胞自动机式自适应神经网络,应比经典的树状结构神经自我裁剪网络更值得期待。

一直没有忘记,研一的傍晚骑着自行车和伙伴们说,感觉这和煦的夕阳像绳子一样联系起了我们每个人,形成了动态社会结构;而我们的信息流动在这些网络上,在阻抗过程中接受时间箭头上的演化。作为实体生死于暗淡蓝点,我们人类一直试图使用几何将世间繁复的信息抽象与压缩,然后复现整个宇宙并期待创造新的宇宙——突破宇宙的奇点。