一个不错的HTML解析器发现这是http://simplehtmldom.sourceforge.net/但它未能奏效需要在PHP
extracting this page http://php.net/manual/en/function.curl-setopt.php
and parse it to plain html, it failed and returned a partial html page
这就是我想做的事, 进入一个HTML页面,并获得组件的个人(的内容所有div和p在一个层次结构中) 我喜欢simplehtmldom的特性,任何这样的解析器都是必需的,它对所有代码都很好(最好和最差)。
好,谁的人必须解析*其他人的*代码它是完全不相关的尊重网络标准的不:-) – Joey 2009-12-09 12:07:42
@Johannes>确实;;但是如果你尝试解析其他人的HTML,那么有一天你或许会不得不生产HTML,而且,那一天,记住解析蹩脚HTML的困难可能会鼓励你编写干净的HTML (跳跃......) – 2009-12-09 12:10:30