RSS 解析:全球内容分发的利器及使用技巧

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测可视化 Grafana 版,10个用户账号 1个月
简介: RSS(Really Simple Syndication)是一种 XML 格式,用于网站内容的聚合和分发,让用户能快速浏览和跟踪更新。RSS 文档结构包括 `<channel>` 和 `<item>` 元素,允许内容创作者分享标题、链接和描述。通过 RSS,用户可以定制新闻源,过滤不相关信息,提高效率。RSS 支持不同版本,如 RSS 0.91 和 RSS 2.0,其中 RSS 2.0 语法简单且广泛使用。RSS 提高网站流量,适用于新闻、博客、日历等频繁更新的站点。RSS 的历史始于 1997 年,至今仍无官方标准,但已成为内容共享的重要工具。

使用 RSS 可以将最新的网络内容从一个网站分发到全球数千个其他网站。

RSS 允许快速浏览新闻和更新。

RSS 文档示例

<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">

<channel>
  <item>
  </item>
  <item>
  </item>
</channel>

</rss>

什么是 RSS?

RSS 代表着真正简单的聚合

RSS 允许您对站点内容进行聚合

RSS 定义了一种轻松分享和查看标题和内容的方法

RSS 文件可以自动更新

RSS 允许为不同站点提供个性化视图

RSS 是用 XML 编写的

为什么使用 RSS?

RSS 旨在显示选定的数据。

如果没有 RSS,用户将不得不每天检查您的网站是否有更新。这对许多用户来说可能太耗时了。使用 RSS 订阅(RSS 经常被称为新闻订阅或 RSS 订阅),他们可以使用 RSS 聚合器(收集和排序 RSS 订阅的站点或程序)更快地检查您的网站。

由于 RSS 数据量小且加载速度快,因此可以轻松地与手机或 PDA 等服务一起使用。

具有类似信息的网络环可以轻松地共享其网站上的数据,以使其变得更好且更有用。

谁应该使用 RSS?

很少更新其网站的网站管理员不需要 RSS!

对于经常更新的网站,如:

  • 新闻网站 - 列出带有标题,日期和描述的新闻
  • 公司 - 列出新闻和新产品
  • 日历 - 列出即将发生的事件和重要日期
  • 网站更改 - 列出更改的页面或新页面

RSS 的好处

以下是使用 RSS 的一些好处:

选择您的新闻

使用 RSS,您可以选择查看您感兴趣且与您的工作相关的新闻。

删除不想要的信息

使用 RSS,您可以(最终)将想要的信息与不想要的信息(垃圾邮件)分开!

增加您的网站流量

使用 RSS,您可以创建自己的新闻频道,并将其发布到互联网上!

RSS 的历史

  • 1997年 - UserLand 的 Dave Winer 开发了 scriptingNews。RSS 诞生了
  • 1999年 - 网景开发了 RSS 0.90(支持 scriptingNews)
  • 1999年 - Dave Winer 开发了 scriptingNews 2.0b1(其中包含 RSS 0.90 功能)
  • 1999年 - 网景开发了 RSS 0.91(其中包含大多数来自 scriptingNews 2.0b1 的功能)
  • 1999年 - UserLand 摒弃了 scriptingNews,仅使用 RSS 0.91
  • 1999年 - 网景停止了他们的 RSS 开发
  • 2000年 - UserLand 发布了官方的 RSS 0.91 规范
  • 2000年 - O'Reilly 开发了 RSS 1.0。此格式使用了 RDF 和命名空间。
  • 2000年 - UserLand 的 Dave Winer 开发了 RSS 0.92
  • 2002年 - 离开 UserLand 后,Dave Winer 开发了 RSS 2.0
  • 2003年 - 发布了官方的 RSS 2.0 规范

RDF 背后的想法是帮助创建语义 Web。然而,对于普通用户来说,这并不太重要,但是通过使用 Web 标准,人们和应用程序之间交换数据将更容易。

应该使用哪个 RSS 版本?

RSS 0.91 和 RSS 2.0 比 RSS 1.0 更易于理解

RSS 2.0 的语法规则非常简单且非常严格。

RSS 是否是 Web 标准?

RSS 没有官方标准。

大约50%的所有 RSS 订阅使用 RSS 0.91

约25%使用 RSS 1.0

最后25%分为 RSS 0.9x 版本和 RSS 2.0

RSS 如何工作?

RSS 用于在网站之间共享内容。

使用 RSS,您可以向称为聚合器的公司注册您的内容。

因此,要成为其中的一部分:首先,创建一个 RSS 文档并将其保存为 .xml 扩展名。然后,将文件上传到您的网站。接下来,注册一个 RSS 聚合器。每天,聚合器搜索已注册的网站以查找 RSS 文档,验证链接,并显示有关源的信息,以便客户可以链接到他们感兴趣的文档。

XML RSS

RSS 文档使用自描述和简单的语法。

以下是一个简单的 RSS 文档:

<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">

<channel>
  <item>
  </item>
</channel>

</rss>

文档中的第一行 - XML声明 - 定义了文档中使用的 XML 版本和字符编码。在这种情况下,文档符合 XML 1.0 规范,并使用 UTF-8 字符集。

下一行是 RSS 声明,它标识这是一个 RSS 文档(在本例中是 RSS 版本 2.0)。

接下来的一行包含 <channel> 元素。该元素用于描述 RSS 源。

<channel> 元素有三个必需的子元素:

  • <title> - 定义频道的标题
  • <link> - 定义到频道的超链接
  • <description> - 描述频道

每个 <channel> 元素可以有一个或多个 <item> 元素。

每个 <item> 元素定义了 RSS 源中的一篇文章或“故事”。

<item> 元素有三个必需的子元素:

  • <title> - 定义项目的标题
  • <link> - 定义到项目的超链接
  • <description> - 描述项目

最后,最后两行关闭了 <channel><rss> 元素。

RSS 中的注释

在 RSS 中编写注释的语法与 HTML 类似:

<!-- 这是一个 RSS 注释 -->

RSS 是用 XML 编写的

因为 RSS 是 XML,所以请记住:

  • 所有元素必须有一个闭合标签
  • 元素区分大小写
  • 元素必须被正确嵌套
  • 属性值必须始终用引号引起来

RSS 中的 <channel> 元素

RSS <channel> 元素描述了 RSS 源。

看以下 RSS 文档:

<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">

<channel>
  <item>
  </item>
</channel>

</rss>

如前所述,<channel> 元素描述了 RSS 源,并有三个必需的子元素:

  • <title> - 定义频道的标题
  • <link> - 定义到频道的超链接
  • <description> - 描述频道

<channel> 元素通常包含一个或多个 <item> 元素。每个 <item> 元素定义了 RSS 源中的一篇文章或“故事”。

此外,<channel> 还有几个可选的子元素。我们将在下面解释最重要的几个。

<category> 元素

<category> 子元素用于为您的源指定一个类别。

<category> 元素使得 RSS 聚合器可以根据类别对站点进行分组。

上述 RSS 文档的类别可能是:

<category>Web开发</category>

<copyright> 元素

<copyright> 子元素通知版权材料。

上述 RSS 文档的版权可以是:

<copyright>2006 Refsnes Data as. 版权所有。</copyright>

<image> 元素

<image> 子元素允许在聚合器呈现源时显示图像。

<image> 元素有三个必需的子元素:

  • <url> - 定义图像的 URL
  • <title> - 如果无法显示图像,则定义要显示的文本
  • <link> - 定义到提供该频道的网站的超链接

元素

<language>子元素用于指定文档所使用的语言。

<language>元素使得 RSS 聚合器可以根据语言对站点进行分组。

上述 RSS 文档的语言可能是:

<language>en-us</language>

<item>元素

每个 <item> 元素定义了 RSS 源中的一篇文章或“故事”。

看以下 RSS 文档:

<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">

<channel>
  <item>
  </item>
</channel>

</rss>

如前所述,每个 <item> 元素定义了 RSS 源中的一篇文章或“故事”。

<item> 元素有三个必需的子元素:

  • <title> - 定义项目的标题
  • <link> - 定义到项目的超链接
  • <description> - 描述项目

此外,<item> 还有几个可选的子元素。我们将在下面解释最重要的几个。

<author>元素

<author> 子元素用于指定项目作者的电子邮件地址。

注意:为了防止垃圾邮件,一些开发者不包括 <author> 元素。

上述 RSS 文档中项目的作者可能是:

<author>hege@refsnesdata.no</author>

<comments> 元素

<comments> 子元素允许项目链接到关于该项目的评论。

<enclosure> 元素

<enclosure> 子元素允许在项目中包含媒体文件。

<enclosure> 元素有三个必需的属性:

  • url - 定义媒体文件的 URL
  • length - 定义媒体文件的长度(以字节为单位)
  • type - 定义媒体文件的类型

将您的 RSS 源放在网络上

如果其他人无法访问您的 RSS 文档,那么拥有 RSS 文档就没有用了。

现在是时候将您的 RSS 文件放在网络上了。以下是步骤:

  1. 为您的 RSS 文件命名。请注意,文件必须具有 .xml 扩展名。

  2. 验证您的 RSS 文件

  3. 将 RSS 文件上传到您的 Web 服务器上的 Web 目录中。

  4. 将小橙色的 RSS 徽标或 XML 徽标按钮复制到您的 Web 目录中。

  5. 将小橙色“RSS”或“XML”按钮放在您将向世界提供 RSS 的页面上(例如您的主页)。然后在按钮上添加一个链接,该链接指向 RSS 文件。代码将类似于:

  6. 将您的 RSS 源提交给 RSS Feed 目录(您可以在 Google 或 Yahoo 上搜索“RSS Feed 目录”)。注意!您的反馈 URL 不是您的主页,而是您的反馈 URL

  7. 将您的反馈注册到主要搜索引擎:

  1. 更新您的反馈 - 在注册您的 RSS 反馈后,您必须确保定期更新您的内容,并确保您的 RSS 反馈一直可用。

我可以自己管理我的 RSS 反馈吗?

确保您的 RSS 反馈按照您的期望工作的最佳方法是

自己管理它。

然而,这可能非常耗时,特别是对于更新频繁的页面。

另一种选择是使用第三方自动化的 RSS。

自动化的 RSS

对于只需要个人网站的用户来说,一些提供内置 RSS 服务的最受欢迎的博客(Web Log)管理器包括:

  • Wordpress
  • Blogger
  • Radio

RSS阅读器
RSS阅读器用于阅读 RSS 源!

对于许多不同的设备和操作系统,都有各种不同的 RSS 阅读器。

有很多不同的 RSS 阅读器。有些作为 Web 服务,有些限于 Windows(或 Mac、PDA 或 UNIX):

  • QuiteRSS - 一个开源、跨平台的 RSS/Atom 新闻源阅读器
  • FeedReader - 一个简单、直接的源阅读器,可以轻松处理大量的源

提示:大多数浏览器都有内置的 RSS 阅读器。如果您访问提供 RSS 源的网站,您将在地址栏或工具栏中看到一个 RSS 图标。单击该图标即可查看不同的源列表。选择您想要阅读的源。

我有一个 RSS 阅读器。现在该怎么办?
单击您想要阅读的 RSS 源旁边的小 RSS 徽标或 XML 徽标按钮。复制您在浏览器窗口中获得的 URL,并将其粘贴到您的 RSS 阅读器中。

RSS参考
<channel> 元素
“元素”列中的链接指向每个特定元素的更多信息。

元素 描述
<category> 可选。为源定义一个或多个类别
<cloud> 可选。注册进程以立即通知更新源的更新
<copyright> 可选。通知有关受版权保护的材料
<description> 必需。描述频道
<docs> 可选。指定用于源中使用的格式的文档的 URL
<generator> 可选。指定用于生成源的程序
<image> 可选。允许在聚合器呈现源时显示图像
<language> 可选。指定源的语言
<lastBuildDate> 可选。定义源内容的最后修改日期
<link> 必需。定义到频道的超链接
<managingEditor> 可选。定义源内容的编辑的电子邮件地址
<pubDate> 可选。定义源内容的最后发布日期
<rating> 可选。源的 PICS 评级
<skipDays> 可选。指定聚合器应跳过更新源的日期
<skipHours> 可选。指定聚合器应跳过更新源的小时
<textInput> 可选。指定应与源一起显示的文本输入字段
<title> 必需。定义频道的标题
<ttl> 可选。指定源可以在从源刷新之前缓存的分钟数
<webMaster> 可选。定义源的 Web 主管的电子邮件地址

<item> 元素
| 元素 | 描述 |
|---------------|--------------------------|
| <author> | 可选。指定项目的作者的电子邮件地址 |
| <category> | 可选。定义项目所属的一个或多个类别 |
| <comments> | 可选。允许项目链接到有关该项目的评论 |
| <description> | 必需。描述项目 |
| <enclosure> | 可选。允许在项目中包含媒体文件 |
| <guid> | 可选。为项目定义唯一标识符 |
| <link> | 必需。定义到项目的超链接 |
| <pubDate> | 可选。定义项目的最后发布日期 |
| <source> | 可选。指定项目的第三方来源 |
| <title> | 必需。定义项目的标题 |

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注

相关文章
|
1月前
|
Linux
百度搜索:蓝易云【深入解析Linux进程内存:VSS、RSS、PSS、USS及查看方式】
通过以上方法,你可以深入了解Linux进程的内存使用情况,包括VSS、RSS、PSS、USS等指标,帮助你进行性能优化和资源管理。
68 12
|
域名解析 存储 边缘计算
《阿里云认证的解析与实战-云计算ACP认证》——云计算ACP训练营第3天——一、内容分发网络
《阿里云认证的解析与实战-云计算ACP认证》——云计算ACP训练营第3天——一、内容分发网络
|
Linux Shell Android开发
Linux内存工具解析之RSS/VSS/USS/PSS区别于联系
Linux内存工具解析之RSS/VSS/USS/PSS区别于联系
1055 0
|
数据格式 XML Android开发
|
XML 数据格式
[UWP]涨姿势UWP源码——RSS feed的获取和解析
原文:[UWP]涨姿势UWP源码——RSS feed的获取和解析   本篇开始具体分析涨姿势UWP这个APP的代码,首先从数据的源头着手,即RSS feed的获取和解析,相关的类为RssReader,所有和数据相关的操作均放在里面。
1535 0
|
移动开发 C# 数据格式
用C#实现RSS的生成和解析,支持RSS2.0和Atom格式
原文:用C#实现RSS的生成和解析,支持RSS2.0和Atom格式 RSS已经非常流行了,几乎所有有点名气的和没名气的网站都有提供RSS服务。 本文详细教你什么是RSS,如是在.Net中使用RSS。 1.那么什么是RSS呢? RSS是一种消息来源格式规范,用以发布经常更新资料的网站,例如博客、新闻的网摘。
1052 0
|
Java Windows
Web版RSS阅读器(四)——定制自己的Rss解析库myrsslib4j
        在上篇博文《Web版RSS阅读器(三)——解析在线Rss订阅》中,已经提到了遇到的问题,这里再详细说一下。         在解析rss格式的订阅时,遇到的最主要的问题是,出现了“Server returned HTTP response code: 403 for URL: http://xxxxxx”的错误,百度一下就知道,这是在网站访问中很常见的一个错误,服务器理解客户的请求,但拒绝处理它。
1120 0
|
Web App开发 JavaScript 前端开发
Ajax 解析RSS
   RSS          Loading....  此代码对于标准的rss,可以正常运行,并兼容IE和FireFox。不过有些网站提供的RSS不规范,导致无法正常解析,比如cnBeta的rss,内容看起来正常,但是他的Content-Type错误。
952 0
|
5天前
|
安全 Java 数据安全/隐私保护
Java基础4-一文搞懂String常见面试题,从基础到实战,更有原理分析和源码解析!(二)
Java基础4-一文搞懂String常见面试题,从基础到实战,更有原理分析和源码解析!(二)
15 0
|
5天前
|
JSON 安全 Java
Java基础4-一文搞懂String常见面试题,从基础到实战,更有原理分析和源码解析!(一)
Java基础4-一文搞懂String常见面试题,从基础到实战,更有原理分析和源码解析!(一)
14 0

推荐镜像

更多