2010-03-22 62 views
1

如何从网上直接提取标题,网页标题?从网页中提取标题

+0

请提供更多细节。 – JoshBerke 2010-03-22 15:34:28

+0

作者:Header你是指''标签的内容吗?或实际的HTTP标头内容? – 2010-03-22 16:03:23

+0

内容 – NikRED 2010-03-23 06:36:42

回答

0

您可以使用正则表达式和WebRequest/WebResponse类的组合来完成此操作。对于任何网页抓取需求,我强烈建议您研究一下使用Simon Mourier的Html Agility Pack,它更加容忍'bad'HTML,并且允许您将DOM作为正确的XML树进行遍历。

0

第1步 - 使用WebRequest从您想要从中提取信息的网页获取WebResponse。

第2步 - 你将最终获得什么本质上是一个字符串,它代表了HTML或XHTML网页,所以你需要的,如果你有任何问题,无论这些剥离出你想要

位步骤,确保你的问题包含大量关于问题的细节。

0

我会使用正则表达式来解析页面HTML为<title>.*?</title>

虽然我不确定你会如何得到“标题”。您需要某种规则来确定标题的样子。

如果它只是head标签,您可以使用前面提到的标题方法来获得该标签。