是否有关于如何解析HTML注释一个很好的参考稳健特别 在HTML中包含的JavaScript可能打破评论解析HTML注释正确
例如:
<!--
<script type="text/javascript">
for(var i = 10; i > 0; i--) {
if(myar[i].status > 3) {
ntlp++;
}
}
</script>
-->
两负的和在脚本中大于3可被认为是 被解释为' - >'的连接(如果您正确地遵循html/sgml规范 )。
无论如何,是否有一个规则/陷阱清单来处理所有这一切?在C中会更好一些,否则伪代码也很好。
感谢
Ashod
是,*使用HTML解析器* :)请参阅解析规则的HTML规范。 – 2012-04-02 04:44:56