我有一个网站更新(人们可以更新内容(文本),而不是网站的外观),其中有HTML,JavaScript作为前端语言& Python作为后端/服务器端。最佳Python模块的HTML解析
我发现,更新HTML是从前端非常困难的,因为当我通过ele.innerHTML或$(ELE)的.html()给出了根据浏览器的HTML改变(抢更新HTML该死IE)。
所以我决定更新从后端,即我的HTML,在Python
你认为什么是最好的Python模块来解析HTML &抢信息?
我的要求是:
- 该模块是ATLEAST在Python 2.5或更小(因为我的虚拟主机提供商的)
- 我会被解析HTML &发现是类的所有HTML元素“更新”
- 对于类“更新”中的每个元素:提取的innerText(而不是HTML纯文本/内容)
你会建议哪个Python模块是最好的呢?
- HTMLParser.py
- htmllib.py
- 任何其他的Python 2.5兼容模块的知道吗?
美丽的汤现在似乎再次活跃,从2012年7月3日发布。http://www.crummy.com/software/BeautifulSoup/ – jforberg
的确,这是个好消息! – David