生物体负责信息处理的组织包含外周神经系统和中枢神经系统,其中后者包括脑和脊髓。而脑则可分为后脑(脑桥和小脑),中脑和前脑(大脑,包括丘脑的间脑,海马体)。大部分位于后脑的脑干(脑间层和脊髓之间不包括小脑的部分)负责诸如呼吸,心跳这样与维持生命密切相关的功能。脑干还在睡眠和梦的产生中发挥着关键作用。
人脑大脑皮层面积约为2600-4100平方厘米,是小鼠的3000多倍。因为皮层厚度一致,这也对应了神经元细胞数的倍数。由于大脑是由众多术业有专攻的模块组成的,因此估计每个模块的能力时,应该关心的不是各个大脑分区的神经元个数的相对比例,而首先是各分区的细胞数。 例如传统上认为由于人类负责嗅觉的脑区相对比例小于小鼠的,故而人类的嗅觉不如小鼠。然而按细胞数来看,人类的嗅觉并不差,其对应脑区和小鼠同样有上千万个神经元[1]。只是相对其他脑区而言,嗅觉所占的比例低了很多。
从线虫这一可以完整研究的神经系统可以看到,细胞数的富余支持了模块化的产生。线虫刚孵化时,中枢神经系统(成为脑或神经环)神经元模块之间的相邻关系已经确定。如图3.1所示,不同颜色代表神经元组成的模块,较粗的线条代表有更多突触的更强的连接[1]。随着线虫长大,神经元细胞数目增多,每个神经元也各自有了多次不同的激活经历。这表现为线虫的神经系统也出现模块化,而模块之间的相对位置是最初的神经细胞之间就已经确立的。

图3.1 线虫中枢神经系统中突触从刚孵化时到成年的模块化示意图,其中的成熟后脑的模块由细胞类型定义,包含感官、运动、调控等,图中还包括了前馈、反馈和循环连接。来自[2]。
与哺乳动物大脑一致,线虫脑的模块化已经符合“就近原则”,相邻神经元之间,而不是更远程的连接可以减少布线,在发育过程中可能也是共同激活的结果。
当前人工智能中,有不少借鉴模块化来提升语言模型效率的尝试,例如[3.6]提出的Mixture of Module(模块混合),实验表示不同规模的 MoMs 始终优于普通的 Transformer,同时能减少推理时的16%的计算量和42%的内存。在更大的更复杂网络中,也会出现类似的模块化。
动物的中枢和外周神经系统,是被进化选择以满足动物日常需求的,在进化树的每个分叉中,多个功能模块各自连续地进化。相比各个模块的相对大小,每个模块包含的细胞数对其发挥的功能可能更为基础。一方面,特定认知功能必须要达到特定数量的神经元,才得以实现;另一方面,为了服务于动物的生存和繁衍,各个认知模块包含的神经元数目只需要够用就好。这意味着在针对特定任务设计人工神经网络时,可尝试使用包含较少神经元的专用网络,而不是套用通用模型。

图3.2 大脑皮层负责感觉和运动的区域对应的身体部位。
人类的躯体感觉皮层和运动皮层有大量区域专门用于处理来自面部、手和脚的输入,它们头脚倒置的排列广为人知(图3.2,3.3)。图3.2右边和3.3左边是传统上认为运动皮层对应不同身体部位,而图3.3右侧展示了一项新研究认为这些区域中间还存在几个整合性的区域。

图3.3:对人体运动皮层经典分区(左图)的更新(右图),来自一项对猕猴和幼儿的功能核磁研究[3],在传统分区中发现了不对具体刺激反应,但在涉及手脚协同、身体转动等动作时活跃的区域(图中标注Action/body)。
人类和猴子大脑皮层的52个布罗德曼区域(Brodmann area),由科尔比尼安·布罗德曼(Korbinian Brodmann)博士在一个多世纪前划分,在指代大脑皮层区域时被广泛使用(图3.4)。这些分区的标准是不同区域的神经元细胞核密度与分布存在差异,例如在尼氏染色后,不同分区间存在过渡。对脑的分区,按功能分更合理,只是当年技术原因只会染色。布罗德曼编号的逻辑多受诟病,但也是个难以重写的历史经典。

图3.4 布罗德曼分区: 细胞核染色,可见I-VI层。
由于大脑空间如此有限,功能域之间的边界可能至少在发育早期的特定时间窗口内是动态的[4]。当前人工智能中,网络的模块化通常是显式的,而[5] 提出的Emergent MoE,在不引入额外参数的情况下,可被视为原始模型的模块化对应物,有效地提升了领域内和领域外的泛化能力。
位于大脑后部的人类视觉皮层,通常使用中心区域来识别面部特征(图3.4)。
图3.5 语言产生和解码相关脑区,来自[6]。
负责说话的布罗卡区和耳朵、听觉皮层都较近。语言的产生还需要经典的布罗卡区周边的几小块区域[6]。广义的韦尼克(Wernicke)区域在语言理解方面发挥功能,它靠近听觉皮层、内嗅皮层和海马体。如前文所述,这很可能是一个通用的(既适用于大脑,也适用于AI系统)组织原则,即将功能相近的区域放置在相邻处。
从进化角度有意思的是,对大鼠的研究发现,位于布罗卡区(传统上对应语言产生)对角的脑区水平肢从脑干将运动速度传递到内侧内嗅皮层,神经元的激活率与运动速度成正比[3.8],从而使大鼠能够在适当的协调下奔跑和停止。
由于人类大脑皮层的生长比位于皮层内部的白质的生长速度更快,大脑皮层显示出其特有的褶皱,可以在组织工程培养中重现出这些沟回结构。正如我们将在本书的后面章节中讨论的,大脑是在现有维度的基础上添加了新的维度,然后即可拥有新的功能。比如在学习记忆中起关键作用的海马区,在哺乳动物大脑中被折叠,被皮层包裹在下方,而这种拓扑结构,为认知功能的扩展带来了一系列新的可能。而蝾螈等两栖类令人羡慕的开脑洞后补全能力,对应的可能是没有折叠进里面的海马区。
虽然与模块化的理念一致,传统上,认为神经活动可被定位在局部的、空间孤立的集群中,这会导致忽略了不同模块之间的功能协同。
参考文献:
[1] McGann, J. P. (2017). Poor Human Olfaction is a Nineteenth Century Myth. Science (New York, N.Y.), 356(6338). https://doi.org/10.1126/science.aam7263
[2] Witvliet, D. et al. Connectomes across development reveal principles of brain maturation. Nature 596, 257–261 (2021).
[3] Gordon, E. M., Chauvin, R. J., Van, A. N., Rajesh, A., Nielsen, A., Newbold, D. J., Lynch, C. J., Seider, N. A., Krimmel, S. R., Scheidter, K. M., Monk, J., Miller, R. L., Metoki, A., Montez, D. F., Zheng, A., Elbau, I., Madison, T., Nishino, T., Myers, M. J., & Kaplan, S. (2023). A somato-cognitive action network alternates with effector regions in motor cortex. Nature, 617, 1–9. https://doi.org/10.1038/s41586-023-05964-2
[4] Arcaro, M. J. & Livingstone, M. S. On the relationship between maps and domains in inferotemporal cortex. Nat. Rev. Neurosci. (2021) doi:10.1038/s41583-021-00490-4.
[5] Qiu, Z., Huang, Z., & Fu, J. (2023). Emergent Mixture-of-Experts: Can Dense Pre-trained Transformers Benefit from Emergent Modular Structures? ArXiv.org. https://arxiv.org/abs/2310.10908v1
[6] Ardila, A., Bernal, B. & Rosselli, M. How localized are language brain areas? a review of brodmann areas involvement in oral language. Arch. Clin. Neuropsychol. 31, 112–122 (2016).
0
推荐


京公网安备 11010502034662号 