2011-04-27 68 views
0
<html> 
<head> 
<title>My Headline</title> 
<meta name="targetUrl" value="xyz.html?sym=abc"/> 
<meta name="summary" value="A & B"/> 
</head> 
<body> 
abc abc, pqr, xyz, rst tsd, prrrr, qqqqqqq, oooooo, opop opop, rtrttrt rtrtrtrt 
</body> 
</html> 

body标签应改为转换为与HTML的meta标签CSV以CSV所以输出应该是这样的:需要帮助下面的HTML

ABC ABC,PQR,XYZ,首先TSD,prrrr ,qqqqqqq,OOOOOO,opop opop,rtrttrt rtrtrtrt

,如果我尝试@吉姆的解决方案

发生

解析例外meta标签,因为他们有特殊字符

+0

这不是一个格式良好的XML文档。在XSLT处理之前,您需要使用一些HTML分析器来构建一个能够成为XSLT处理器输入的DOM实例。根据你的环境,这可能是一个重复的问题。 – 2011-04-28 22:31:22

回答

0

下面是一个XSLT1解决方案

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0"> 
    <xsl:output method="text"/> 
    <xsl:template match="@*|node()"><xsl:apply-templates select="@*|node()"/></xsl:template> 
    <xsl:template match="body"><xsl:value-of select="text()"/></xsl:template> 
</xsl:stylesheet> 

注意,因为你的输入包含前一个换行符和数据后,它会被写入到输出好,结果是第一条和最后一条空白。

+0

它可能更短:' \t \t ' – 2011-04-27 18:18:53

+0

感谢Jim的回答,非常感谢。 – SMG 2011-04-27 20:20:15

+0

我有在html中的特殊字符的元标记,我想通过使用上面的xsl @Jim忽略,@Alejandro是否有可能跳过元标记,如果我能得到一个示例xsl实现这一点,将不胜感激。 – SMG 2011-04-28 16:11:57