我有一段叫做Rss-Aware的软件,我试图使用它。它基本上是桌面馈源检查器,用于检查RSS源是否已更新,并通过Ubuntu的Notify-OSD系统提供通知。如何从Google Reader导出的OPML文件中提取Feed URL?
但是,要知道需要检查的内容,您必须在每个供稿网址之间的换行列表中逐个列出〜/ .rss-aware/rssfeeds.txt文本文件中的供稿网址。例如:
http://example.com/feed.xml
http://othersite.org/feed.xml
http://othergreatsite.net/rss.xml
...似乎很简单的权利?那么,我想要使用的提要列表将作为OPML文件(这是一种XML)从Google Reader中导出,我不知道如何解析它才输出提要网址。它似乎应该是非常直接的,但我很难过。
如果有人可以在Python或Ruby中提供实现,或者我可以从提示中快速完成,我很乐意。一个bash脚本会很棒。
非常感谢你的帮助,我是一个非常薄弱的程序员,很想学习如何做这个基本的解析。
编辑:另外,here is the OPML file我试图从中提取饲料网址。
...你可以在xmlstarlet的bash管道中使用XPath。 – a3nm 2011-04-23 08:50:44