我目前正在试图让一个程序,给一个单词将查找其定义并返回它。尽管我已经完成了这项工作,但我不得不求助于使用RegEx来搜索存储定义的标签之间的文本。什么是更有效的方式来使用Python 3.x做到这一点?Python的HTML解析
0
A
回答
5
lxml适用于Python 3.它具有兼容ElementTree的API,但在后台使用c库,所以速度很快,并且支持Xpaths,这是一种很好的解析方式(有时)。
4
尝试BeautifulSoup一个很好的用于Python的HTML解析器。 (也适用于Python 3.x,尽管除非深入Python 3.0项目,请考虑使用2.7)
2
当谈到HTML解析时,您的要求相当简单。 Python标准库包含ElementTree模块,它应该有助于完成您计划执行的任务。查找该页面中给出的示例代码片段。
另外,从来没有犯的错误解析HTML/XML使用正则表达式。你可能不知道什么时候它会变得非常复杂,在任何情况下也是一个坏主意。
相关问题
- 1. Python html解析
- 2. Python:解析wordpress HTML
- 3. 解析HTML与Python
- 4. html解析器python
- 5. 的Python - BeautifulSoup - HTML解析
- 6. Python的 - 解析HTML类
- 7. Python:用BeautifulSoup解析HTML
- 8. 用Python解析html标记
- 9. Python和BeautifulSoup解析HTML
- 10. Python - 整理HTML解析
- 11. Python,解析html表格
- 12. 使用Python解析HTML
- 13. 用python和bs解析HTML
- 14. 在Python中的jQuery的HTML解析?
- 15. 使用beautifulsoup解析python中的html
- 16. 与python的win32com和解析html问题
- 17. 一个快速的Python HTML解析器
- 18. Python 3中的HTML解析器
- 19. 的Python/BeautifulSoup解析HTML馏分
- 20. 最佳Python模块的HTML解析
- 21. BeautifulSoup(Python)和解析HTML表格
- 22. 使用R或python解析HTML属性
- 23. Python 3 - HTML解析器 - 空属性
- 24. 解析Python文本并保存为html
- 25. Python原始字符串和html解析
- 26. 从桌面解析HTML与Python
- 27. 在Python和XML解析HTML页面
- 28. 未找到python html解析器数据
- 29. 在Python中使用BeautifulSoup解析HTML
- 30. 在Python中使用lxml解析HTML,xpath
请先尝试搜索。 http://stackoverflow.com/search?q=%5Bpython%5D+html+parse所有这些问题都适用于您的问题。 – 2011-02-04 11:13:00
[如何获取Python中Html页面的内容]的可能重复(http://stackoverflow.com/questions/2416823/how-to-get-the-content-of-a-html-page-in-蟒蛇) – 2011-02-04 11:14:22