在C#正则表达式 - 获取所有href和innerTexts?
我试图同时获得URLs
和InnerTexts
从一个文本文件,我没有访问DOM对象我使用这样只有正则表达式的设备(仅文本文件)上使用。
<a href="/LinkClick.aspx?fileticket=a random text string">I want this text</a>
我需要所有这些集合整个文本文件:
URL = /LinkClick.aspx?fileticket=a random text string
TITLE = I want this text
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Joe 2011-12-24 20:22:53
试图用RegEx解析数据并不是一个好主意。如果你有HTML文本文件,你可以访问DOM。例如,“使用System.Windows.WebBrowser ... HtmlDocument hdoc = HtmlPage.Document;” – paulsm4 2011-12-24 20:24:22
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1758162#1758162 – 2011-12-24 20:34:59