2015-05-19 77 views
-1

我正在使用雅虎管道从Reddit获取RSS源,以便稍后与其他提要结合使用。雅虎管道正则表达式提取超链接

该物品的链接重定向回Reddit。我希望它重定向到实际的内容。

为了让我这样做,我需要从item.description中提取一个超链接,并用它替换item.link。

http://i.stack.imgur.com/kYJZf.png

我知道我需要使用正则表达式模块来做到这一点。

我试过不同的正则表达式命令的变体,我在其他地方发现堆栈溢出,但我不能让他们做我需要的东西。

有谁知道我可以用item.description中的URL替换item.link吗?

回答

0

对于任何与雅虎管别人挣扎,你这是怎么做到这一点

开始与“获取的XPath”

模块中输入URL,在这种情况下https://www.reddit.com/r/unitedkingdom

转到该网址并点击浏览器中的“查看源代码”(Chrome中的F12)

选择保存所有Reddit帖子的“框架”的路径。在这种情况下,它是:// * [@ ID = “siteTable”]/DIV

下一个模块 - “创建RSS”

标题:item.div.1.p.0.a.content

链接:item.div.1.p.0.a.href

默认情况下,reddit的联系是 “item.div.1.ul.li.0.a.href”,这将指引你到Reddit评论部分,但是我想要的内容的链接在“item.div.1.p.0.a.href”下。

然后,这将创建一个RSS标题,然后直接链接到内容的链接,而不是Reddit评论部分。