博客、RSS 新闻聚合器和 ATOM [第一部分]






3.64/5 (13投票s)
2005年3月2日
9分钟阅读

69076
本文将向您介绍 RSS 的含义,以及它的标准、历史和版本。
引言
在本文中,您将了解 RSS 标准、历史和版本,还将熟悉下一代新标准 ATOM。此外,您还将了解博客、新闻阅读器及其演变简史,以及博客与 RSS 之间的密切关系。大多数(如果不是全部)新闻网站和机构都支持链接到最新新闻或突发新闻的新闻源。实际上,我认为一个不显示新闻源魔法图标的网站是一个糟糕的网站。您可以在 CodeProject 上找到最新文章和网站新闻的源,因此每个人都应该熟悉新闻源的概念,无论是开发人员还是新手用户!
背景
每天早上,我都会访问 BBC 网站查看最新发布的新闻,然后是 MSDN 上新发布的文章,然后跳到 CodeProject 查看最新文章。您难道不觉得这个过程很乏味吗?老实说,我有时也会感到痛苦,情绪低落,我想您也一样。那么,如果您能通过某种工具获取一个网站或成千上万个网站的所有最新内容,然后离线也能获取这些网站精华呢?我认为这将是一个很棒的工具。这个工具对网站内容的重要性就像 Outlook Express 对邮件服务器的重要性一样,您可以获取所有邮件,然后离线阅读,随时都可以查看。
将要介绍的内容?
本文分为两部分;第一部分将向您介绍 RSS 标准的历史和演变,以及从 RSS 演变而来的下一代标准 ATOM,以及什么是新闻阅读器。第一部分对所有人(包括非开发人员)都将清晰明了。第二部分将向您展示如何创建自己的新闻源,以及如何消费他人的源并将一个网站的精华或最新内容显示在您自己的网站上。
Weblogs 和博客作者
Blog 是 WebBlog 的缩写。它是“记录”到网站的过程。Blog 是一种媒介,作者在其中撰写日记式网站,读者可以对提供的内容或主题做出回应。博客作者是指在博客中撰写或回应主题的个人。博客涵盖从政治到化学等广泛的兴趣领域!您可以在 MSDN 上查看一些博客。
立即免费获取您的博客
实际上,现在没有人没有博客了。您可以拥有自己的博客,注册并记录您的想法,上传您周末的照片,写下您的技术笔记,写下您喜欢的引言,总之,拥有一个博客来表达您自己的想法。今天,您拥有许多免费的博客引擎。您可以查看 Blogger,Blogging。您可以在 这里 查看我的博客。
.NET 最知名的博客引擎
- dasBlog:此博客将数据存储在 XML 文件中。
- .Text:使用 SQL Server 存储数据。这是一个开源项目,您可以下载并查看代码。您可以安装和配置它。您可以在 gotdotnet 网站上查看 .Text 的工作区。
.Text
是最强大的博客引擎,因为它是 ASP.NET 博客的驱动程序。
什么是 RSS?
想象一下,您在一个博客上发布了一条帖子,然后等待回应,您可能在 1 分钟、1 小时,甚至 1 天或 3 天后才能收到回复;这样您就需要一遍又一遍地访问博客来检查是否收到了您问题的答案!这多么糟糕和无聊!您觉得有没有某种技术,可以用一种标准、约定俗成、众所周知的格式为您提供某个博客或其他网站的所有内容?这就是 RSS,这就是时髦词!您可以使用属于新闻聚合器应用程序范畴的程序来获取一个网站或博客的精华。网站(包括博客)通过提供一个位于 URL 的动态生成的 RSS 文档来提供其内容(或最有用的内容)的源。RSS 文档只不过是一个 XML 文件(哇!又是 XML)。似乎每一种新技术或标准都严重依赖 XML。
RSS 文档可以包含以下任何内容,并且更多
- 天气状况
- 股市
- 论坛最新帖子
- 出版商书籍
- 在线竞价
- 文章列表
- 最新新闻
- 供应商产品
- 博客文章
- 技术相关问题
RSS 聚合器和新闻阅读器
RSS 聚合器就是新闻阅读器,那么什么是新闻阅读器呢?它是一个读取 RSS 文档的应用程序,并将文档中的条目以可读的、精美的视图列出。您可以通过简单地将输出 RSS 文档的 URL 输入到您的 RSS 聚合器中来订阅 RSS 源,这样就完成了!您就可以轻松获得该网站最有价值的内容,您可以过滤内容,阅读关于已发布软件程序或产品的简报,如果您喜欢简报,您可以直接访问完整内容。此外,您还可以搜索旧条目。市面上有许多 RSS 聚合器,如 NewzCrawler,SharpReader,SlashDot。SharpReader 是免费的,而 NewzCrawler 比 SharpReader 更强大、更易于使用,但它不是免费的。此外,您还可以获得在线新闻聚合器,当您需要从任何地方查看您的源时,它会很有用,但缺点是您需要登录才能查看您的源,您没有桌面新闻阅读器的离线阅读功能。您可以查看 NewsGator。您可以在 这里 查看几乎所有可用的新闻聚合器列表,所有这些聚合器都支持 RSS 2.0(更多关于版本的内容稍后介绍)。
RSS 阅读器的常见功能
- 大多数 RSS 聚合器应用程序让您感觉就像在阅读您的电子邮件,就像您使用 MS Outlook 或任何其他邮件程序一样,其中大多数在左侧有一个树状结构,列出所有源(频道),右侧是频道的条目。
- RSS 聚合器有一个内置浏览器,因此您可以直接在同一个应用程序中阅读完整的故事;无需复制粘贴 URL 并在外部窗口中打开,它在后台使用 IE 基础架构。
- 现在我可以从我的桌面阅读所有我需要的技术文章,组织有序,直达要点,没有琐碎的问题,您所要做的就是获取 RSS 文档的 URL,然后在我的 RSS 聚合器应用程序中添加新频道,就完成了。
大多数网站都通过 RSS 提供或联合内容,例如,新闻机构如 Wired、Cnet、Yahoo、NPR News、Reuters、CNN、BBC、BBCArabic。您可以直接从您的桌面阅读所有这些内容,您只需要一次性选择它们,然后断开连接,您就拥有了这些巨头网站的所有精彩内容。多么棒,多么令人惊叹!它节省了大量时间,避免了您对最常访问的网站进行繁琐的重复访问。
您需要查看 syndic8 或 blogdigger 以获取更多 RSS 链接。
RSS 搜索引擎
Feedster 是最知名的搜索 RSS 文档的搜索引擎。Feedster 抓取所有 RSS 文档和博客,并返回一个完整的列表,包括所有搜索结果。您会惊叹于它的界面与 Google 非常相似!您还可以查看 Blogdigger,它是最好的博客搜索引擎之一。
RSS 代表什么?!这并非易事!
- Netscape 创建了 RSS 0.90 的原始格式。它是第一个版本,代表“RDF Site Summary”或“Rich Site Summary”。NetScape 提供 RSS 0.90 用于其门户活动,但其他人看到了更有效的用途。Userland Software 采纳了这个想法,并成为第一个在其 Weblog 产品中商业化使用 RSS 的公司。
- RSS 0.90 基于 W3C 提供的 RDF“Resource Description Framework”。RDF 非常复杂,因此 Userland 推出了新版本,并称之为 RSS 0.91。它不包含 RDF。Userland 推出了许多新版本,包括 0.92、0.93 和 0.94,为了证明其追求简单的趋势,他们让 RSS 代表“Really Simple Syndication”(真正简单的联合)。
- 出现了一群开发人员,重新采用了 RDF 版本(RSS 0.90),因为他们认为它比 Userland 的 RSS 版本更灵活。经过一番努力,他们发布了 RSS 1.0,代表“RDF Site Summary”,又回到了版本和缩写的问题上!
- Userland 认为 RSS 1.0 可能会取代 RSS 0.94,因此他们发布了一个新版本 RSS 2.0,它也代表“Really Simple Syndication”。这就是我们今天的立场!
- 所以我们有两个分支;一个基于 RDF,另一个是 Userland 的,不基于 RDF。因此,您有两种共享相同名称但版本号不同的技术。我起初很困惑,因为我以为 RSS 2.0 是 RSS 1.0 的续集。真是混乱!
ATOM,一个新的联合时代
一群新的开发人员不喜欢这种混乱,所以他们正在一个名为 Atom 的项目上工作。它是一项新的联合技术。Atom 解决了几乎所有 RSS 的问题,包括版本混乱,可由任何人扩展(就像 XML 一样),Atom 技术类似于 RSS 1.0 和 RSS 2.0,它承诺提供一个标准的存档格式,以及一些称为(Atom API)的 API。一些网站现在正在以 Atom 格式发布它们的联合内容。大多数 RSS 聚合器支持所有 RSS 版本,只有少数支持 Atom。
BlogRoll,OPML 语言
您认为播放列表对多媒体文件(条目)的重要性如何?是不是很棒?BlogRoll 简单来说就是收集的博客源的集合,大多数博主会为访问者提供 blogrolls。这为对特定主题感兴趣的访问者提供了大量链接。我认为它就像一个播放列表。Outline Processor Markup Language 是一种基于 XML(又是 XML)的语言,用于编写 blogRolls。如今大多数聚合器都可以读取 BlogRolls 并轻松提取其中包含的源。多么棒!
结论
正如您所见,RSS 和博客是尖端技术,每个网站都应该提供指向 RSS 或 ATOM 源的链接。您应该获取一个新闻阅读器,安装它,向您的新闻阅读器添加频道,保持更新。在本文的 第二部分 中,我将向您展示如何消费他人的源并将条目显示在您的网站上,您将能够创建自己的网站源,我们还将分析 RSS 版本和 Atom 的模式。
许可证
本文没有明确的许可证,但可能包含文章文本或下载文件本身的使用条款。如有疑问,请通过下方的讨论区联系作者。作者可能使用的许可证列表可以在 这里 找到。