我需要使用C#获取HTML文件正文标签内的所有内容。有没有什么好的和有效的方法来做到这一点?阅读<body>使用C#编写HTML文件的标签
回答
它很容易将页面代码拖到一个字符串中,只需搜索字符串“< body”和字符串“</body”的出现,然后只需要一点数学算法即可获得您的值。
退房的HTML Agility Pack做各种HTML操作
它给你有点类似于XmlDocument
XML处理接口的接口:
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
HtmlNode bodyNode = doc.DocumentNode.SelectSingleNode("/html/body");
if(bodyNode != null)
{
// do something
}
你可以看看SgmlReader和HTML Agility Pack。
SgmlReader的这个URL导致了一个很老的版本,这个版本多年来一直没有被触及。这些天维护SgmlReader的人是MindTouch。由于其较低级别的方法和主动维护,我建议使用SgmlReader而不是HtmlAgilityPack。 http://developer.mindtouch.com/en/docs/SgmlReader – 2010-10-27 21:02:06
如果你的HTML格式不符合XHTML,我认为你会发现SgmlReader(和上面的注释中使用mindtouch版本)是最好的选择。 – nrkn 2010-10-27 23:19:36
@asbjomu - 通过mindtouch站点上的转换示例,我找不到一个SgmlReader生成与浏览器匹配的DOM的单个示例。我不知道HTML Agility Pack是否更好,但我没有留下深刻的印象。 – Alohci 2010-10-27 23:33:13
如果碰巧是XHTML,那么你可以使用XPath。
使用XML方法,XPath。要使用HTML进行更高级的操作,请使用HTML Agility pack。
- 1. 文件阅读和C#编写
- 2. 阅读标签在c + + delimeted文件
- 3. Android文件编写,阅读
- 4. 阅读用bigendian编写的文件
- 5. 阅读写作nfc标签
- 6. C#流阅读器阅读文本文件到RichTextBox的插图中[]标签
- 7. 阅读HTML表格数据/ html标签
- 8. 阅读从C用Java编写的文件
- 9. 阅读* .tiff和* .eps文件的标签
- 10. 阅读ID3 MP3文件的标签
- 11. 如何阅读HTML文件正文标签
- 12. 在.docx文档中使用.Net编写并阅读隐藏标签
- 13. 阅读标签分隔文件到ArrayList <ArrayList>在Java
- 14. 使用JSON文件中的html标签阅读内容并在javascript中显示
- 15. 阅读txt文件和编写词典
- 16. 阅读标签为几个MP3文件
- 17. 如何阅读< abc: xyz >使用PHP的XML标签?
- 18. 阅读文件时的C#编码
- 19. 阅读的文本文件,编程使用Objective-C
- 20. 使用熊猫阅读html文件,Python
- 21. 如何使用javascript编写<map>和<area> html标签?
- 22. 需要帮助编写和阅读C#中的XML文件#
- 23. C#如何阅读像ID3标签的视频文件
- 24. 使用C#的XML文件阅读器
- 25. 阅读写作WAV/RIFF标签
- 26. 如何使用Python在其文本中使用包含html标签的xml标签编写XML文件?
- 27. 从网站快速阅读HTML标签
- 28. 阅读标签Id
- 29. pdf阅读标签
- 30. 在C编写,阅读和拆分文件
这是一个磁盘上的文件还是您要下拉的网页? – R0MANARMY 2010-10-27 20:32:50
对不起,刚开始接受,我的错误 – 2010-10-27 20:41:21
和是我是需要解析的文件的所有者 – 2010-10-27 20:41:40