2008-12-11 64 views
3

我与Yahoo! pipes鬼混,我用一些正则表达式打墙。现在我熟悉Perl的正则表达式,但是这些规则在Yahoo!中似乎有所不同。管道。在Yahoo!上正则表达式管道

Screen shot of my pipe http://lanzkron.googlepages.com/pipe.PNG

我在做什么是抓取的网页,并试图把它变成一个饲料,我从HTML剥离出来的链接正则表达式工作正常,但我想要的标题是什么在<i>标签只是输出原始文本。

在Perl和这个 online regexp tester匹配

示例文本:

<一个相对= “nofollow” 目标= “_空白” HREF =“http://changed.to/protect/the-guilty。 HTML “> <我> ”收费网络连接佛乐“(英国文豪)< /我> </A >(另见本其他网站<一个rel = ”nofollow“ 的目标= ”_空白的“ href =” HTTP://计算器.com“> Nada </a >)其他文字

回答

6

正则表达式的标题:

(?i).*?<i>([^<]*).*    [ ] g [x] s [ ] m [ ] i 

正则表达式的链接:

(?i).*?href="([^"]*).*   [ ] g [x] s [ ] m [ ] i 

不知何故不区分大小写的复选框似乎打破。幸运的是,你可以用(?i)替代,这很好用。

这是一个很好的web2.0-ish工具来测试正则表达式:RegExr。但由于某种原因,它仍然是测试版。 ;-)

2

YP需要注意的一件重要的事情是不要相信调试屏幕,它有一个隐藏一些标记的小怪癖,它可以在尝试重新编码时不会造成混淆。揭露任何隐藏的html用'#'代替'<'

相关问题