的特定部分,我已经有了一个称号的结构是这样的:正则表达式 - 拿到冠军
<title>WebsiteName | Page title | Slogan</title>
目前,在C#中我用这个,拿到冠军了:
Regex.Match(pageSource,
@"\<title\b[^>]*\>\s*(?<Title>[\s\S]*?)\</title\>",
RegexOptions.IgnoreCase).Groups["Title"].Value;
但是,我想出去的只是网页标题。
是,HTML你解析? – Anirudha 2013-05-08 17:46:55
你想要在你提供的标题中匹配什么?只是'页面标题'? – 2013-05-08 17:51:21
分解你的问题。使用DOM解析工具的som形式来解析html。请参阅下面的答案。然后在标题内容中使用正则表达式或简单的字符串。 – Mithon 2013-05-08 18:00:27