ISATIS - 新操作系统构想
本文是关于一个名为 ISATIS 的新操作系统的。
引言
计算机的数量正在高速增长。事实上,如今我们中的大多数人每天都拥有不止一台计算设备,或者与不止一台设备进行交互。人与计算机的关系也随着时间的推移而改变。如果我们想用图表来表示,将会是下面的样子:
![]() |
图1. 过去50年人机关系图。(Vertegaal, 2003) |
正如你所见,在过去的50年里,计算机数量和人机关系发生了巨大的变化。如今,当我们去ATM取钱,使用公司电脑处理日常事务,或在校园内使用ISU电脑进行教育目的时,我们都在使用非我们自己的计算机。如果我们试图坐下来弄清楚我们每天如何与我们周围不同的计算设备进行交互,那将是极其困难且耗时的。另一方面,其中许多计算机不属于我们,我们对它们的访问权限有限,因此我们无法按我们希望的方式修改它们。这提出了一个令人费解的困境:“我们应该按照计算机希望我们的方式行事,还是应该让计算机按照我们希望它们的方式行事?”这与莎士比亚一句名言“生存还是毁灭,这是一个问题”相关。
过去20年计算机的发展方式,类似于“隔离”的概念。现在,“隔离”已无意义,因为除了我们自己的计算机外,我们还使用许多共享的计算机。计算机就像婴儿,需要时刻关注。它们会不断发出数百个有趣的警告、消息和确认等。它们需要我们的关注才能继续执行任务。研究人员意识到,我们的注意力是一种有限的资源。某事物越能吸引我们的注意力,我们的生产力就会越低。注意力用户界面(AUI)旨在管理这种有限的资源(我们的注意力)。基于AUI的设计通过与用户协商材料,而不是强迫用户关注某事物来运作。(Vertegaal, 2003)
AUI的一些例子
Microsoft Office 2007
当用户第一次打开任何Microsoft Office 2007产品时,屏幕右上角的Office徽标会开始闪烁,请求用户注意。这是一个AUI的例子,它向用户发出注意信号。第一次打开应用程序是触发此通知的条件。
![]() |
图2. Microsoft Office 2007产品的闪烁徽标试图吸引用户注意。 |
Windows Live Messenger
Windows Live Messenger可以是使用AUI的另一个好例子。Live Messenger使用两种不同的信号与用户进行协商。
- 通知区域:当有新邮件或好友登录/注销时,会从Windows通知区域弹出多种类型的窗口。所有这些通知都是可自定义的,用户可以根据自己的需求进行更改。用户还可以为每种类型的通知设置声音警报。
- 如果程序主页或任何打开的聊天窗口中发生某事,应用程序不会将自己移到前景,而是会在Windows任务栏中开始闪烁,请求用户注意。同样,用户可以修改所有通知并为每种通知分配声音警报。
![]() |
![]() |
图3. A. Windows Live Messenger中的弹出窗口。 | 图3. B. 闪烁的任务栏按钮请求用户注意。 |
我们做不到什么
AUI的目标是让计算机像与人交互一样与用户交互,而不是像哑巴机器一样。首先想到的是人工智能(AI)。AUI设计需要利用AI来行动如我们所想,并且知道该做什么。让我们深入探讨一下。一个人知道一切的可能性有多大?当你遇到一个知道一切并且认识你的人时,你遇到他的可能性有多大?你怎么知道一个人知道一切?一个人有可能知道一切吗?机器有可能包含宇宙所有知识,或者至少是地球上的知识吗?如果存在这样的机器,那么它是机器还是上帝?此外,人与机器的关系已经变成了一对多的关系。有可能预测Chase ATM在Alamo II外面谁将是下一个用户吗?因此,我们有两个非常重要的限制:
-
我们无法将地球上所有的知识保存在一台机器上。
-
我们无法准确预测多用户机器的用户是谁。
因此,我们需要在计算机中使用AI,以用户友好、有意义且实用的方式与用户进行交互。
我们想做什么
AUI要求在不分散用户注意力的情况下与用户协商。AUI领域已经进行了多项研究。注意力显示是最受欢迎的主题,其中机器试图在视觉上跟踪其用户。语音命令和识别领域也有几项研究。微软推出了Anne,这是Windows Vista的PC新自然语音。如果你还没试过,我建议你试试。Anna的声音非常接近人声。所有这些努力都表明,我们希望计算机更像我们。我们希望它们能看到我们,与我们交谈,并理解我们的意图。想象一下,你正在和你的电脑一起工作。你的电脑说:“嘿,John,Anna想和你谈谈”(它不会显示弹出窗口或任何其他视觉干扰)。你很忙,没有时间,所以你说,“不行!告诉她我很忙,晚点再给她打电话。”然后,你的电脑告诉Anna你刚才说的话,然后挂断。
一个可行的AUI应该基于AI,并且与之密不可分。对于所有交互,如面部跟踪、交谈和听力,我们需要AI。此外,在做出决策时,我们也需要AI。如果我想用一个简单的图来表示,它看起来会是这样的:
这与中枢神经系统相似,不是吗?这就是我们希望计算机像人类一样行动——而不是像机器。
根据图4,在AI领域和定义的帮助下,我们可以发现,无论生意、逻辑和对话部分的所有可能场合,唯一保持不变的部分是决策单元(DMU)。换句话说,DMU是图中唯一一个即使其他部分都改变了也会保持不变的部分。如果我们想象任何发生的事情,我们都用大脑来做决定,这并不难。我们通过经验获得知识,我们通过工作的领域获得业务逻辑,然后我们根据这两者为事件做出决定。为什么在计算机世界里不能发生类似的事情呢?
当前AI应用的另一个问题
知识存储是当前AI应用中一个不容易解决的问题。在这些应用程序中,没有自动或半自动的机制允许它们在相同应用程序的不同实例之间共享知识。一些专门从事安全的公司使用集中的AI系统——通常是面部识别系统。然而,这些系统是为组织级别设计的,而不是为个人设计的。此外,并非每个人都可以积极训练应用程序。大多数面向个人的AI应用程序运行在一个系统上,并且没有选项可以在具有相同知识存储的其他机器上使用这些应用程序。
总而言之,人工智能应用有两个主要的依赖项:
-
机器依赖性
-
知识依赖性
如果有一个平台可以解决这两个问题,那么我们就可以在各处看到越来越多的AI应用。
想法
一个类似的故事
当今互联网世界的技术进步以及科学家们对其的预测,对计算机世界来说是一个警钟。互联网的设计并非考虑到今天的需求。多年来,开发人员在原本没有这些功能设计的东西上添加了新的需求。目前,它看起来像是在一栋1800年代建筑之上建造了一座闪亮的塔楼。它能工作,它很耀眼,每个人都在使用。然而,它随时可能崩溃。美国和欧洲的许多科学家开始从头开始构建Internet II。他们意识到修补当前的互联网很快就会变得不适用。同样的事情现在也发生在计算机世界。开发人员在尚未设计用于执行这些任务的东西之上添加新的功能。计算机世界的主要限制是“隔离”。尽管Windows和Unix类操作系统拥有大量的通信和网络功能,但它们所有的OS内核都基于隔离。
也许微软研究院和瑞士苏黎世联邦理工学院是第一批听到警钟的团队。他们开始了一个名为“Barrel Fish”的新项目,这是一个从头开始的新OS。这个新OS的主要变化在于它能够运行多核并在网络上共享核心(这是当前操作系统所缺乏的)。更多信息,您可以访问其官方网站:http://www.barrelfish.org
发展这个想法
计算机总是要求我们关注。事实上,它们不断地用成百上千个请求轰炸我们(Vertegaal, 2003)。计算机用户界面(UI)的基本原理在过去20年里变化不大。如今,你会发现我们正在使用一些非常古老的技术。计算机操作系统基本上有两种类型。Microsoft Windows运行在近90%的计算机上,而Unix/Linux类操作系统占其余部分。Unix/Linux可以追溯到40多年前,而Windows可以追溯到30多年前。
计算机领域的许多科学家花费了多年时间来研究如何管理我们与计算机的交互,以便计算机能够根据我们的需求进行调整。有几种设计可以帮助我们更好地管理这种关系,其中之一就是使用注意力用户界面(AUI)。
![]() |
图5. 使用虚拟圆锥体可视化用户注意力。首先,用户的注意力集中在驾驶任务上。最终,AUI中移动的图标引起用户注意,并向用户提供额外信息。(Novak, Sandor, & Klinker, 2004) |
![]() |
图6. Mirjam Netten的《婴儿》作为一件注意力艺术品,Human Media Lab,金斯顿。初始图像(a)和多次观看后的图像(b)。(Holman, Vertegaal, Sohn, & Cheng, 2004) |
此外,对于为计算机和计算机应用程序增加更多智能化元素的需求也在不断增长。可能看起来AI和AUI之间没有直接关系,但AI已经改变了我们周围的许多事物,并且这种趋势也正在影响用户界面部分。一些新应用,如增强现实、图像阅读器、语音识别应用程序和其他程序,都是已在使用的现有应用程序的例子。它们旨在让我们的生活更轻松,并且基于AI。但所有这些应用程序中变化最明显的部分是我们与计算机交互的方式。语音和手势识别等是新的交互方式。回到图1,它告诉我们,我们与计算机的关系正在转变为一对多的关系,这已经开始。另一方面,我们有基于隔离的老式操作系统。将所有这些片段放在一起,我希望得出结论,使我的想法更有意义。
ISATIS
什么是ISATIS
我给我的想法起了一个名字,叫做ISATIS[1]。ISATIS是一个基于AI的新操作系统,不仅支持新型用户界面,甚至支持正在开发中的用户界面。ISATIS将仅限于身份,而不是设备。这意味着,如果你拥有一个ISATIS身份,你将能够根据需要或意愿在其他机器上使用相同的身份。所有运行相同身份的设备将以用户看到的统一功能方式运行。此外,一台设备将不限于只拥有一个身份,ISATIS核心将允许同时运行多个身份。这种设计超越了所有当前的限制,创造了一种新的人机交互方式。
在设计ISATIS时,我一直想着尽可能地使其人性化。不同的ISATIS身份将能够像人类一样相互交流,并且能够共享它们的知识。ISATIS唯一的缺点可能是它可能需要特殊的硬件才能运行。
为什么是ISATIS?
计算机世界需要一次重大升级。当前没有一个操作系统能够支持新的需求——特别是AUI特性——在核心层面。ISATIS被设计用来支持这些新特性,甚至包括未知的特性。它创建一个虚拟世界,机器能够识别其用户,并且没有设备限制。用户将拥有一个身份而不是一个系统来工作。用户将在他们的台式机、笔记本电脑、手机以及其他可以运行ISATIS核心的设备上与相同的身份进行交互。用户的身份将收集有关他们的信息(知识),以根据他们的需求调整一切。用户与机器的交互将不限于任何类型的单一输入设备。任何新的(甚至是未知的)都可以轻松地嵌套到操作系统中,因为它能够根据新需求进行调整。操作系统可以思考。它会检测你拥有的所有其他设备,并将相同的身份分发到这些设备上。ISATIS是设备无关的未来关键。
规格
ISATIS将…
- 支持多对多人机模型。
- 允许用户拥有自己的身份。
- 允许在多台机器上同时运行相同的身份。
- 允许在同一台机器上同时运行多个身份。
- 为所有应用程序提供基础AI API。
- 使用新的安全算法通道保护其用户数据。
- 支持不同身份之间的知识共享。
- 识别其用户。
- 如果所有者授权通信,则允许多个身份互相通信。
ISATIS将不会…
- 向其用户提供整个宇宙的知识,但它可以提供所有共享的知识。
- 允许在同一台机器上运行同一身份的多个实例。
- 允许任何两个或多个身份或同一身份的多个实例之间的任何开箱即用通信。
- 允许身份直接访问任何系统资源。例外情况将不予考虑。
- 拥有我们今天所知的系统管理员。
设计
![]() |
图7. ISATIS设计。 |
ISATIS核心 提供硬件底层通信。核心可以控制和管理所有正在运行的身份。核心控制不超出身份边界。换句话说,核心可以控制正在运行的身份,但不能控制它们内部发生的事情。核心还控制通信通道,并禁止任何外部通信。
通信通道 所有身份之间的通信都应通过通信通道进行。不允许其他通信模式。
核心服务 提供系统标准服务。
身份核心 身份核心控制和管理在其内部运行的所有其他组件。
知识 这是主要的知识存储库,它保存身份收集到的关于用户的所有知识。不允许直接访问知识。所有请求都应通过身份核心进行。
身份服务 身份服务是在所有身份之间通用的服务。
应用程序 可以在特定身份上运行各种类型的应用程序。
第三方服务 由外部世界提供的服务,不属于系统的一部分。
知识共享设计
![]() |
图8. 知识共享设计。 |
使身份不同的原因在于它们的知识。事实上,在现实世界中,是人们的知识让他们与众不同。知识这个词不单指我们所知道的,也包括我们是什么或我们拥有的东西。在计算机世界中,物理所有权没有意义。因此,知识的所有权部分意味着数据所有权。ISATIS通信通道可以超越设备边界,通过云端传输,找到通往其他设备的方式。为此,ISATIS核心能够与其他核心进行协商。然后,身份的核心可以通过建立的通信通道进行通信,并访问其他实例。这将允许同一身份的多个实例进行对话并同步它们的知识以获取最新数据。另一种选择是使用托管在云端的知识存储,同一身份的所有实例都可以与之同步。
AI API
参考图4;决策引擎单元可以根据知识、业务逻辑和输入做出不同的决策。因此,通过提供不同的知识、业务逻辑和输入,它将能够处理不同的决策。位于核心之上且在身份之下的ISATIS服务为身份提供了决策能力。任何身份都可以访问其知识(包括业务逻辑),传递输入参数,并要求服务做出决策,然后将结果中继回身份。这种模型将AI引擎移动到身份层之下。因此,如果AI引擎需要更新,唯一需要刷新的是AI引擎,而不是整个系统。
另一方面,尽管ISATIS无法访问身份的内部系统,但它将能够管理到AI引擎的必要事务和数据传输。此外,ISATIS核心会连接到设备硬件。如果需要从输入设备收集任何输入,收集到的数据就不需要进行不必要的往返才能到达AI引擎。AI API将AUI/AI引擎集中在一个地方。当需要更新时,更新一个地方比更新几个未知区域要容易得多。
结论
我们期望计算机与我们互动的方式已经改变。我们希望我们的机器更像人类,而不是无思想的机器。人机模型也发生了巨大变化。当前的操作系统基于隔离,而新的人机模型显示出多对多的关系。当前的操作系统无法满足新需求,似乎有必要进行重大升级。ISATIS可以是计算机世界的未来关键。它是一个新的、基于身份(基于知识)的操作系统,能够识别其用户。它不依赖于设备,用户可以在不同的机器上运行任意数量的自己身份的实例(不能在同一台机器上运行同一身份的多个实例)。ISATIS创建了一个虚拟世界,用户可以在其中以相同的方式与所有设备进行交互,因为所有设备上都运行着相同的身份。用户还可以将他们身份的知识存储在云端。ISATIS还为所有运行的实例提供人工智能功能和API。由于知识会在身份的不同实例之间同步,因此无需为每个设备单独训练系统。相同的训练可以用于所有设备。因此,ISATIS满足了当今的计算需求,也许也满足了未来的需求。
参考文献
Chen, D., & Vertegaal, R. (2004). Using Mental Load for Managing Interruptions in Physiologically Attentive User Interfaces. Vienna, Austria: ACM.
ETH Zurich Switzerland, Microsoft Research Cambridge. (2009, November). The Barrelfish Operating System. Retrieved November 2009, from http://www.barrelfish.org
Holman, D., Vertegaal, R., Sohn, C., & Cheng, D. (2004). Attentive Display: Paintings as Attentive User Interfaces. Vienna, Austria: ACM.
Jackie Lee, C.-H., Wetzel, J., & Selker, T. (2006). Enhancing Interface Design Using Attentive Interaction Design Toolkit. Cambridge, MA: MIT Media Laboratory.
Jaimes, A. (2006). Posture and Activity Silhouettes for Self-Reporting, Interruption Management, and Attentive Interfaces. Japan: FXPAL Japan, Corporate Research Group, Fuji Xerox Co., Ltd.
McCrickard, D. S., & Chewar, C. (2003). Attuning notification design to user goals and attention costs. COMMUNICATIONS OF THE ACM.
Novak, V., Sandor, C., & Klinker, G. (2004). An AR Workbench for Experimenting with Attentive User Interfaces. Munich, Germany: IEEE.
Phifer, G., Harris, K., Raskino, M., & Jones, N. (2007). Consumerization and User Interfaces. Gartner, Inc.
Vertegaal, R. (2003). Attentive User Interfaces. Ontario, Canada: COMMUNICATIONS OF THE ACM.
[1] ISATIS是伊朗一座城市亚兹德的古称。