时忽略DTD与XOM XML库分析文件时,我怎么能忽略DTD的声明。我的文件中有如下一行: <?xml version="1.0"?>
<!DOCTYPE BlastOutput PUBLIC "-//NCBI//NCBI BlastOutput/EN" "NCBI_BlastOutput.dtd">
//rest of stuff here
当我尝试建立()在我的文档,我得到了DTD文件
我正在使用NekoHTML清理一些HTML,然后将其提供给XOM以获取对象模型。在这个过程中的某个地方,评论正在逃脱。 这里的输入HTML的相关的例子(大部分<head>切割为清楚): <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<ht
我想解析由XOM的外部系统返回的一些HTML。该HTML如下:(其实它显著理出头绪,但它有这个DOCTYPE声明,这些名字空间和语言的声明,以上展品HTML同样的问题,因为真正的HTML) <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtm