65.9K
CodeProject 正在变化。 阅读更多。
Home

大脑如何工作 - 皮层柱作为信息引擎

starIconstarIconstarIconstarIcon
emptyStarIcon
starIcon

4.54/5 (4投票s)

2019年7月23日

CPOL

10分钟阅读

viewsIcon

10329

downloadIcon

231

组织成信息检索系统的新皮层皮层柱。

本文将大型信息检索软件(搜索引擎)的通用设计与大脑皮层柱的解剖结构进行类比。结论是,它们的组织方式非常相似,皮层柱的作用可能是存储、检索和处理信息,同时还有一个“索引”区域。

引言

人类大脑以惊人的速度访问信息。过去的记忆几乎瞬间就会被调到当前。与我们正在思考的某人相关的场景会在几秒钟内浮现。我们通过涉及的元素(人、动物、物体等)来回忆一个记忆。当我们重新想象一个场景时,我们主要关注实体,而较少关注低级细节。一个真实的人脸可能会触发一个直接与某些旧记忆相关的模式,但我们可以在没有任何视觉输入的情况下做到这一点,只需尝试记住那个人。

显然,我们的大脑中一定存在某种快速信息检索机制

索引

假设我们有大量带有各种内容的编号书写页面(第 1 页、第 2 页、第 3 页……)。其中一些页面可能包含“cat”一词。如果我们想检索所有包含“cat”一词的页面,我们需要逐页阅读。检索所有“cat”页所需的时间显然是巨大的。

但这个问题有解决方案。我们可以一次性阅读所有页面,并将所有包含“cat”一词的页面写在一个列表中(3、5、18……等)。下次我们想要所有“cat”页面时,我们不必再次阅读所有页面,而是查看该列表并直接跳转到那些页面。检索所有“cat”页所需的时间会减少多个数量级。实际上,在计算设备上,检索时间是几毫秒。

我们第一次阅读所有页面时,也可以记录其他单词以及它们出现的页面

  • cat - 3, 5, 18, ....
  • 食物 - 4, 5, 23, ....

这将允许快速检索包含这些单词的页面。我们甚至可以进行交集(例如,第 5 页同时包含“cat”和“food”),这实际上是搜索引擎的工作方式。

这个列表带有允许更快访问数据的引用,被称为“索引”,而构建它的操作被称为“索引”。现在我们可以想象,与其是写在纸上的页面,我们可以有带标签的图像。我们可以索引这些标签,几乎瞬间检索到所有包含猫的图像。或者,与其是图像,我们可以是经历、记忆、场景、上下文/生活片段,其中一些涉及猫。如果我们的索引中的“cat”条目指向包含猫的那些,我们将立即检索到所有包含猫的场景。

我们甚至可以制作索引的索引(或分层索引),因此需要访问的信息量会非常巨大。

搜索引擎概览

为了大规模检索信息,一些软件系统会构建大型索引。首先,一些计算机从互联网网站下载大量页面,读取其中的所有单词,并构建索引,该索引不仅包含每个单词的页面编号,还包含丰富的元数据(检索日期和时间、页面 URL、页面内的分数等)。例如,在一台计算机上,我们可能会有一个这样的索引

cat: 
 page 1
  url: www.cats.com/syamese1.htm
  date: 2019-04-05 13:44:22
  score: 35/100
 page 2
  url: www.cats.com/syamese2.htm
  date: 2019-04-05 13:44:23
  score: 38/100

分数可能反映了猫与内容的关联程度,是否出现在标题中,出现次数等。当我们想要所有“cat”页面时,搜索引擎会从索引中列出所有cat页面,然后按分数排序,向我们显示最相关的页面。如果我们搜索“cat food”,系统会将“cat”页面与“food”页面相交,并向我们显示一个排序列表,其中包含同时包含这两个单词的页面。

搜索引擎节点/集群

基本上是一台计算机,在 Brin 和 Page 创建 Google 时,按照今天的标准,它非常弱。这台计算机构建并持有自己的索引,也可以从中检索数据。然而,某些架构可能会将其拆分为 2 台计算机,一台用于索引,一台用于数据检索。

因此,一个搜索节点包含一个本地索引文件和执行以下操作的软件

  • 数据存储:它抓取互联网,下载页面,解析页面内的单词,将页面引用及其元数据放入本地索引文件。
  • 数据检索:在接收到某些外部查询(cat)时,它会检查索引文件,并将包含这些单词的页面返回给调用者。
  • 数据处理:它拥有自己的软件和先进的算法来处理页面,构建和读取索引文件。

由于软件格式的限制,这台计算机可以缓存 10-20 百万条书写页面。当他们创建 Google 时,创建者非常关注优化和 16 位数据传输。检索页面以进行查询的时间是几毫秒。

多集群架构

单个集群/节点可以保存与 10-20 百万个页面相关的信息(2000 年),大约 10 GB 数据(索引和页面缓存)。如果我们将更多页面存储在不同的节点上并同时查询所有节点会怎么样?如果我们分发这种架构,我们基本上可以索引无限数量的页面。

因此,如果我们有一个中央单元接收查询“cat”并将其分发给一百万个集群,它们都可以同时启动并检查各自的索引以查找包含“cat”的页面。时间基本上与单个集群相同,因为它们都并行工作。每个集群的顶级结果会被整合、重新排名并呈现给用户。检查的数据量是巨大的,因为我们有一百万个集群,每个集群包含 10-20 GB 的数据。将查询分发到所有集群的时间可以忽略不计,因为这只是传输,没有数据处理。这样,Google 可以在几毫秒内显示“cat”的结果,检查了数十亿个页面。为了索引整个互联网,Google 拥有拥有数百万个节点的服务器场。

皮层柱作为集群

关于皮层柱的目的存在许多假设。我的理论是,单个皮层柱的作用与搜索引擎中的节点相同。皮层柱检索自己的数据,对其进行处理,并像搜索集群一样将其呈现给调用者。同时,它可能构建或帮助构建存储在上层的索引。基于多处相似之处,本文假设大脑是这样工作的。

  • 让我们考虑一个猫的经历(场景),一个蹒跚学步的孩子第一次看到一只cat,他试图去摸它,cat可能会喵喵叫,妈妈说“安德鲁,别碰cat”。
  • 这个经历通过感官(眼睛、耳朵)记录,并且完整的场景直接存储在新的皮层柱(或多个)的特定感觉区域中。
  • 在存储它的同时,场景被分解成元素(概念、实体):momcatsounds
  • 由于蹒跚学步的孩子以前已经处理过其中一些概念,它们已经存在于中央记忆(边缘系统)中。如果这是一个新概念,它将被添加到概念列表中。
  • 存储完整场景的新皮层柱然后被链接到存储在边缘系统中的概念,就像索引指向新页面一样。所以“mom”现在也指向这个新柱。
  • 边缘系统中的每个概念都存储着它们相关的皮层柱的完整列表,就像索引文件一样(或者可能是某些中间层进行本地索引)。

这里最大的假设是存在一个索引(可能在边缘系统中),其中包含现有概念(英语词典中约有 100 万个单词,可能可能的概念总数不会差太多)。这个概念索引结构将每个概念链接到相关的皮层柱(它们出现的场景)。具有每个感觉/区域本地索引的架构也可能存在于皮层柱的上层。神经可塑性有助于创建新的神经连接以适应新场景,并将当前柱移到下一个,就像在电子学中一样。

大脑和皮层柱这样工作的关键论点是,目前没有其他已知方法比索引更能以毫秒级的速度查找一生中记录的数百万个场景,而大脑正是这样做的。我们不知道这个索引在哪里,但我们有与搜索集群类似的柱和桶。所以皮层柱的秘密不在于它们的结构,而在于它们连接到什么。从那里,我们也许可以弄清楚它们到底有什么用,以及它们实际上是如何工作的。

更多论证

  • 神经学家无法通过观察神经元的放电来弄清楚皮层柱在存储什么(假设他们是在活体生物上进行的)。将整个大脑视为一个大型信息引擎实际上是不可能的,因为它不仅需要数学和计算机知识,还需要运气才能设计出这样的系统。
  • 追踪轴突的连接也非常困难。但如果我们知道要寻找什么,可能会有帮助。传递信息到皮层柱的轴突数量少于 16,这与原始 Google 设计使用的位数相同。
  • 存储的信息还包含与记录时事件的时间和地点相关的元数据(就像索引一样)。
  • 皮层柱直接与感官连接,就像节点检索自己的页面并对其进行处理一样。
  • 信息是模块化的,丢失一部分大脑可能导致记忆丧失,但处理仍然存在,并且可以重新分配。在某些集群发生故障的情况下,搜索引擎仍然可以从剩余集群中提供相关信息。
  • 相似之处令人惊叹,即使是节点存储的信息量在数量级上也差不多,20GB 对比 150GB(一个拥有 100-200 个神经元的皮层柱被认为可以存储约 150GB 的信息)。

遗留问题

以下问题的答案可能会证实或完善这一理论

  • 概念索引在边缘系统中的位置在哪里?
  • 每个大脑区域是否都有更多的概念索引,按感官划分?
  • 概念索引如何添加新概念并将其连接到新柱?
  • 皮层柱的答案如何连接回概念索引?
  • 一旦发现了概念索引,概念如何组合以执行逻辑?
  • 柱之间的水平连接有什么作用?

结论

皮层柱的主要作用与信息检索有关,并且可能存在某种“概念索引”结构存在于边缘系统或皮层柱的上层。还有许多开放性问题可以完善这一理论,并揭示更多关于大脑的理解。

如本文所示,如果该理论被证明有效,为了涵盖正确反向工程大脑所需的所有知识,可能需要一门新学科,它应该包括以下方向:数学、神经学、解剖学、计算机科学、电子学

参考文献

历史

  • 2019 年 7 月 23 日 - 首次提交
© . All rights reserved.