开放式超媒体系统中的节点分类





0/5 (0投票)
我们提出了我们的节点分类技术,以帮助用户识别不同节点的类型,从而提供导航辅助。
摘要
超媒体系统可以在互联网的任何地方找到,从在线学习网站到社交网络网站。超媒体系统提供了极大的导航自由度,其丰富的链接结构,但这种导航自由度也成为一个问题,并导致“迷失在超空间”的问题。
人机交互(HCI)领域的大多数研究都集中在从用户界面的角度看超媒体系统的可用性,但很少有人致力于解决超媒体系统底层链接结构的可用性问题。
在本文中,我们探讨了与超媒体结构可用性相关的问题。我们(i)探讨了超媒体用户遇到的问题,例如“迷失在超空间”问题;(ii)解释了人类记忆组织和心智模型;(ii)论述了哪种超媒体结构更适合组织信息;(iii)引用了发现超媒体结构中层次结构的技术;(iv)最后,我们提出了我们的节点分类技术,以帮助用户识别不同节点的类型,从而提供导航辅助。
关键词
超媒体结构、可用性、层次结构、节点分类。
1. 引言
“超文本”指的是一组信息节点,节点之间通过一系列链接连接。当节点中存储的信息不仅是文本,还包括图像、音频、动画和视频时,就被称为“超媒体”。超媒体结构指的是节点之间的底层链接结构。
超媒体系统的主要优势在于其灵活的结构,并赋予用户极大的自由来浏览和交互其中包含的信息[31]。正是这种自由导致了许多问题;超媒体系统固有的问题之一是用户倾向于在系统的信息迷宫中迷失方向。这通常被称为“迷失在超空间”(Lost In Hyperspace)。
Nielsen 将“迷失在超空间”描述为“超文本的一个主要可用性问题”[30],并提出为了帮助用户导航超空间,必须提供辅助手段来帮助用户理解和识别其在整体结构中的当前位置。合乎逻辑的进展是将用于组织物理空间的技术应用于电子空间。这样,用户就可以将他们在物理空间中学到的导航技能应用于电子环境中的导航。
在城市设计领域,Lynch 总结道,人们会描绘他们的物理环境(作为心智图或认知图),他发现受试者经常回忆起特定的特征,例如节点(集线器)、地标(在较大空间中可识别的参考点)、路径(地点之间的路线)和边缘(边界),这些特征在物理环境中被有效地用于导航[26]。为了利用这一点,一些研究人员试图研究从物理环境中获得的导航策略在多大程度上可以应用于电子环境。特别是,Botafogo 等人[5] 和 Modjeska & Marsh [28] 试图在电子环境中识别地标,以便用户可以将他们在物理环境中学习到的导航技能应用于电子环境的导航。
为了促进电子环境中的导航,必须以结构化的方式组织环境。这里出现的问题是,哪种组织结构最适合用于构建知识领域?在本文中,我们认为层次结构是组织信息领域的最佳结构。
2. 迷失在超空间
用户经常缺乏在超媒体结构中的直观位置感和方向感,不知道用户当前在整体结构中的位置,也不知道从那里开始是最好的前进方向?计算机科学文献将此称为“迷失在超空间”问题。
Foltz 和 Davis [19] 认为“迷失在超空间”问题是由于空间设计不当和导航提示不足,尤其是在描述和定位物理环境方面。
这个问题似乎是由于不熟悉超媒体结构,而不是用户不熟悉信息内容[31]。
在一项实验中,Elm & Woods [17] 让超文本系统的用户完成了一系列信息检索任务,发现“迷失在超空间”的程度与他们在信息领域的专业水平无关。
根据他们的研究,勾勒出了三种不同的**迷路**形式:
- 不知道下一步该去哪里。
- 知道该去哪里,但不知道如何到达。
- 不知道自己在整体结构中的位置。
“迷失在超空间”问题似乎是一个与导航相关的问题,要有效地解决这个问题,必须扩展和采用在物理环境中使用的导航策略来辅助电子环境中的导航。
3. 超媒体结构
那么,如何才能构建超媒体系统以最小化认知开销并最大化连贯性呢?
已经提出了许多可能的结构。实验中使用的三种典型结构是“热词”(hotwords),“层次图”(hierarchical maps)和“蜘蛛图”(spider maps)。“热词”是嵌入在文本主体中的链接。“层次图”提供信息的分层图形表示,类似于组织结构图。“蜘蛛图”,也称为“概念图”,提供更详细的信息图形表示,具有更广泛的非线性交叉链接,类似于蜘蛛网。Beasley & Waugh [2] 的研究结论是,在感知定向障碍方面存在显著差异,使用“热词”的受试者定向障碍最多,而使用“层次图”的受试者定向障碍最少[2]。
另一项比较“热词”和“超图”(hypermap) 结构的研究显示,在记忆力方面没有差异,但使用“热词”的组报告了显著的困惑和沮丧[33]。一种解释是,“热词”之所以被认为令人困惑和沮丧,可能是因为“热词”会从用户那里消耗额外的认知资源。例如,用户必须记住长串的链接,才能解释知识领域中不熟悉的词语。
在另一项研究中,Modjeska & Marsh [28] 对代表两种结构类型(强1&弱层次结构1)和两种大小(小&大)的网站进行了实验。他们的实验产生了一些初步结果。在网站规模上,结构对用户导航有显著影响,强层次结构的网站比弱层次结构的网站访问的节点数量更多。网站结构对用户感知有显著影响,强层次结构的网站比弱层次结构的网站感知更小。他们得出结论,强层次结构比弱层次结构更可用。
3.1 发现超媒体结构中的层次
我们引用了多项文献,表明层次结构最适合用于构建用户对系统的心理模型,因此需要一种方法来发现现有超媒体系统中的层次结构,以便自动发现任何新节点。
Botafogo 等人[5] 报告说,超媒体系统的作者被鼓励创建层次结构,但在编写时,由于包含了交叉引用链接,层次结构会丢失。他们提出了恢复丢失的层次结构和发现新层次结构的方法;他们还建议通过使用度量标准来识别超媒体结构的属性,以帮助作者。这些度量标准可以用来捕捉超媒体结构的有益属性。
要找到结构中的层次,必须执行两个任务:首先必须识别根节点,然后必须区分层次链接和交叉引用链接。他们建议以下作为**根节点**的基本属性:
1. 它必须能够访问超媒体中的几乎所有节点。
2. 从根到任何其他节点的距离不应太远。
如果根到节点的距离非常大,将会出现导航问题。用户在到达所需信息之前必须经过很长的路径。
3. 最后,根节点必须有合理的子节点数量。
广度优先搜索(BFS)算法可以应用于根节点,以区分超媒体结构中的层次链接和交叉引用链接。
4. 我们的实验
我们进行了一项初步实验,以扩展 Botafogo 等人的方法;实验的目的是将超媒体结构编码到距离矩阵中。这样我们就可以帮助用户识别结构中的地标,并做出一些额外的观察,以辅助超媒体结构中的导航。
使用 HTML 解析器(用 Java 编写)遍历网页上的链接,以捕获网站的完整链接结构到距离矩阵中。图 2 展示了一个示例来说明这个想法。
图 2. 示例说明:图(a)及其“距离矩阵”(b)和“转换距离矩阵”(c)。在(c)中,用一个大的值替换无穷大,K=4(转换常数>表中任何单个条目)
该实验设计用于计算入链(来自其他页面的指向当前网页的链接)和出链(指向其他网页的链接)的数量。出链数量最多的网页被归类为索引页,入链数量最多的网页被归类为引用页。
该实验成功地从捕获的网站中识别出了索引页和引用页,但仅仅识别索引页和引用页并不能为用户提供足够的帮助来高效地导航结构,尤其是在大型和复杂的超媒体结构中。
一个基本想法是,一本书存在某种关于书的期望或模式,以及它是如何组成的。我们知道我们可以查看索引来查找信息的位置。随着对文本的熟悉程度的提高,读者会越来越熟悉文本中的各种地标以及它们之间的关系。读者实际上是基于方向线索构建文本的心理模型。
这些对于构建心理模型至关重要的方向线索在许多超媒体系统中都缺失[31]。
基于以上观点,我们从实验中了解到,需要更全面的节点分类来识别超媒体系统中各种不同的节点类型,以使结构更易于理解,并协助用户在结构中进行寻路活动。
5. 节点分类
节点分类必须产生比仅索引和引用节点更多的类别,以分析每个节点在整体结构中的位置以及超媒体结构中可能存在的可用性问题。
我们将节点分为以下几类:
自引用节点:
这些节点顶部包含链接,并且被分割成部分,使得顶部的每个链接都指向同一节点的不同部分。爬虫可以轻松识别它们,因为它们的链接包含#以表示自引用。
死胡同节点:
这些节点没有任何出链。
索引节点
这类节点包含大量的出链,并且它们到其他节点的距离相对较小。它们也是少数能够到达网站上大多数节点的节点之一。网站地图是这类节点的绝佳示例。
入口选择节点:
这类节点出现在网站的开头,用于选择居住国家或语言。该节点通常指向超媒体的不同部分(子结构)。它们的出链指向子结构的(根)。
信息节点:
这类节点比出链拥有相对较高的入链。入链值可能非常低或为 0(死胡同节点也可以是信息节点)。
Applet 节点:这类节点包含 applet 标签,可以归类为 applet 节点。
数据输入节点:包含大量表单标签的节点,这表明用户可以输入数据(用户响应)。此外,这些节点也只有少量的出链,即提交按钮。
搜索节点:这些类型的节点包含搜索机制。
文件下载 - 包含 PDF 或 EXE 文件等文件下载的页面。
6. 结论与未来工作
在本文中,我们讨论了超媒体系统用户面临的主要问题,例如“迷失在超空间”(LIH)问题。我们引用了之前的研究,这些研究表明这是一个与导航相关的问题。解决这个问题的方法是,通过采用用于物理环境导航的技术来增强超空间中的导航。为了向用户提供导航辅助,超媒体系统必须告知用户关于距离感、方向感以及他们在整体结构中的当前位置的信息;类似于地区的地理地图。简而言之,识别超媒体结构中的地标将提供一个简化的结构视图;它将减少认知开销,并将有助于超媒体结构中的导航。
为了更好地理解这个问题,我们进行了基于 Botafogo 等人方法的实验,以识别超媒体系统中的地标,如根节点。
我们的实验的一个关键发现是,仅仅识别根节点并不能真正解决“迷失在超空间”问题。我们认为,通过将节点分为几个类别,例如自引用节点、数据输入节点等,可以最大程度地减少“迷失在超空间”现象。这可能有助于用户回忆起他们正在寻找哪种类型的节点?并可以根据用户所需的节点类别应用搜索过滤器。
我们的另一个关键发现是,应该有不同类别的链接,每个类别可以用不同的颜色表示以提供用户反馈,这会使爬行更容易,因为爬虫可以被编程为以不同的方式处理不同的链接类别。
此外,我们相信一旦识别出地标,就可以将附加的
这些地标属性必须在每次
访问次数可以显示为热力图。
局限性
我们当前的爬虫无法读取安全套接字和身份验证机制。目前,我们不解析附加到网页的 CSS(层叠样式表)。
优点
当前实现可以快速抓取损坏的 URL,并可以生成网站链接结构的图形表示。我们可以将地标属性数据与网站链接结构合并,例如,到特定地标的访问次数可以表示为网站地图上的热力图。
可能的应用
该爬虫可用于构建网站链接地图,并且(正在开发的)可视化工具可以向用户显示此地图,显示用户在整体结构中的当前位置以及结构中可能的下一步操作。
对于未来的工作,我们希望进行真实的用户实验,以证明本文提出的节点分类的有效性。
我们正在开发一个工具,该工具将为作者和用户提供超媒体系统的简化视图。我们的下一篇文章将基于这个工具。
7. 参考书目
[1] Asahi T, Turo D and Shneiderman B, Visual decision-making: Using treemaps for the Analytic Hierarchy Process. Proceedings of CHI'95 Conference, |
[2] Beasley, R.E., & Waugh, M.L. “Cognitive mapping architectures and hypermedia disorientation: An empirical study,” Journal of Educational Multimedia and Hypermedia, (4:2/3), 1995, pp. 239-255. |
[3] Berk, E. and J. Devlin (1991). What is hypertext? In E. Berk and J. Devlin (Eds.), Hypertext / Hypermedia Handbook, pp. 3 -- 7. |
[4] Bonfigli M, Casadei G, Salomoni P. Adaptive Intelligent Hypermedia using XML, Proceedings of SAC 2000 - ACM Symposium on Applied Computing, Villa Olmo, Como, Italy, March 2000, Vol. 2, pp.922-926. |
[5] Botafogo Rodrigo, Rivlin Ehud and Shneiderman Ben, “Structural Analysis and Useful Metrics.” ACM transactions on Information Systems, Vol. 10, No.2, April 1992, pp. 142-180. |
[7] Calvi, L, De Bra, P. Improving the Usability of Hypertext Courseware through Adaptive Linking, Proceedings of the Eighth ACM Conference on Hypertext, pp. 224-225, |
[8] Catledge L, & Pitkow J. “Characterzing Browsing Strategies in the World Wide Web”, In the Journal of Computer Networks and ISDN System, Vol 27, pp 1065-1073, Elsevier Science, 1995. |
[9] Charney, D. “Comprehending non-linear text: The role of discourse cues and reading strategies”. In Proceesings of the hypertext ’87 Conference (Charlotte, N.C., Nov. 13-15, 1987). ACM, |
[10] Chen, S. Y. (2002) A Cognitive Model for Non-linear Learning in Hypermedia Programmes. British Journal of Educational Technology. 33(4), 453-464. |
[11] Collins, A M., & Quillian, M.R (1969). Retrieval time for semantic memory. Journal of Verbal Learning and Verbal Behaviour, 8, 240-247. |
[12] Conklin, J. Hypertext: An introduction and survey. IEEE Computer, 20, 9 (Sept. 1987), 17–40. |
[13] Darken, P., Sibert, J. 2001, Wayfinding Strategies and Behaviors in Large Virtual Worlds. In Proceedings of the 10th international conference on |
[14] David Canter, |
[15] Dix, Finlay, Abowd, Beale: Human Computer Interaction, Prentice |
[16] Ehud Rivlin and Rodrigo Botafogo and Ben Shneiderman. “Navigating in hyperspace: designing a structure-based toolbox”. Communications of the ACM, Vol. 37, No.2, pages: 87-96, 1994. |
[17] Elm, W.C., Woods, DD., 1985. Getting lost: a case study in interface design. Proceeding of Human factors society ACM press, 927-931. |
[18] Fillion F., Boyle C,. Important issues in hypertext documentation usability. Proceedings of the 9th annual international conference on Systems documentation, |
[20] Griffin J, Randolph G. Web Experience And Hypermedia Structure In Online Learning, Proceedings of the seventh annual consortium on Computing in small colleges midwestern conference, 2000, pp. 44 – 53. |
[21] Halaz F.G., Moran, T.p, and Trigg, R.G. “NoteCard in a nutshell”. In proceedings of the ACM CHI + GI’87 (Toronta, Ont., Apr. 5-9, 1987). ACM, |
[22] HARARY, F., |
[23] Hongjing Wu, Erik de Kort, Paul De Bra. Design Issues for General-Purpose Adaptive Hypermedia Systems, |
[24] Johnson-Laird, P.N. Mental models. In M.I. Posner, Ed., Foundations of Cognitive Science. MIT Press, |
[25] KAUFMANN, A. Graphs, dynamic programming and finite games. In Mathematics in Science and Engineering 36. Academic Press, |
[26] Kevin Lynch, (1960). The Image of the City. |
[27] Lokuge, |
[28] Modjeska D, Marsh A. Structure and Memorability of Web Sites, Working Paper in the Department of Industrial Engineering, |
[29] Nielsen J, Usability Engineering, Academic |
[30] NIELSEN, J. The art of navigating through hypertext. CACM 33, 3 (March 1990), 296–310. |
[31] Otter, M. & Johnson, H. (2001): Lost in hyperspace: metrics and mental models. Interacting with Computers 13 (1), 140 |
[32] Reed, W.M., & Oughton, J.M. “Computer Experience and Internal-based Hypermedia Navigation”. Journal on Computing in Education, 30(i), 1997. |
[33] Reynolds, S.B., & Dansereau, D.F. “The knowledge hypermap: An alternative to hypertext,” Computers in Education, (14), 1990, pp. 409-416. |
[34] Riding, R., & Rayner, S.G. (1998). Cognitive styles and learning strategies. David Fulton Publisher, |
[35] Rudolph P. Darken and John L. Silbert, “Wayfinding Strategies and Behaviors in Large Virtual Worlds.” In Human Factors in Computing Systems: Proceedings of CHI '96. |
[36] Searleman, A., & Herrman, D,. Memory from a Broader Perspective, McGraw-Hill Press, |
[37] Sougata Mukherjea and James D. Foley, “Showing the Context of Nodes in the World-Wide Web.” In Human Factors in Computing Systems: Proceedings of CHI '95 (Companion Volume). |
[38] Sougata Mukherjea and James D. Foley. “Showing the Context of Nodes in the World-Wide Web.” In Human Factors in Computing Systems: Proceedingsof CHI '95 (Companion Volume). |
[39] Theng, Y.L., "Lost in hyperspace? A look at four viable approaches," HCI'95 Adjunct Proceedings, |
[40] Thuring, M, Hannemann, J, & Haake, J. M. Hypermedia and cognition: designing for comprehension, Communications of the ACM, (38:8), 1995, pp. 57-66. |
[41] Thüring, M., Haake, J.M., and Hannemann, J. What’s ELIZA doing in the Chinese Room? Incoherent hyperdocuments–and how to avoid them. In Proceedings of Hypertext´91. ACM Press, |
[42] Tomek and H. Maurer. Helping the user to select a link. Hypermedia, 4(2):111-122, June 1992. |
[43] Van Dijk, T.A., and Kintsch, W. Strategies of discourse Comprehension. Academic Press, Orlando, 1983. |
[44] Woodhead, N., Hypertext and Hypermedia: Theory and Applications, Sigma |