2012-08-15 51 views
3

我正在学习HTML解析。在令牌化阶段,字节流被标记为令牌。标准HTML标记化支持有多少种标记类型?它是否包含开始标记标记,评论标记等内容?HTML5标记化有多少个标记类型?

这些注释是否会被视为令牌并附加到DOM树上?

回答

4

The HTML specification says:

标记化步骤的输出是一系列的零个或多个下列标记:DOCTYPE,开始标记,结束标记,注释,文字,结束文件。

所以有六种不同的标记。

要回答你的最后一个问题:评论是代币,并有DOM interface for them