我想提取html页面中<head>
标记元素之间的所有内容。包括链接标签和脚本标签。使用XSLT提取HTML元素
假设下面的源代码是一个片段,它将成为完整的html文档的一部分。
来源:
...
<head>
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<script type="text/javascript" src="main.js"></script>
<script type="text/javascript" src="second.js"></script>
</head>
...
XSLT:
<xsl:output method="xml" encoding="utf-8" indent="no"/>
<xsl:template match="/">
<xsl:copy-of select="link"/>
</xsl:template>
这工作正常,如果只有一个标签,我试图让。有没有一种方法可以处理所有事情,只有“头”标签之间的所有内容。
我预计会是输出:
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<script type="text/javascript" src="main.js"></script>
<script type="text/javascript" src="second.js"></script>
您能否提供一个更完整的源文档示例,以及您期望的输出示例? – 2013-05-07 17:38:30
通常,只能在符合XML的数据(如XHTML)上使用XSL。如果你的输入不是XHTML,你可能会在某个时候得到解析异常。 – 2013-05-07 22:53:53