2016-03-15 53 views
-2

我有大量的文件中包含以下a.html的结构:XSLT拆分1个HTML成n HTML

<html> 
    <body> 
    <div class="a">aaa 
     <div class="b">bbb</div> 
     <div class="c">ccc1 
     <div class="d">ddd11 
      <div class="e">eee11</div> 
      <div class="f">fff11 
      <div class="g">ggg111</div> 
      <div class="g">ggg112</div> 
      <div class="g">ggg113</div> 
      <div class="g">ggg114</div> 
      <div class="g">ggg115</div> 
      <div class="g">ggg116</div> 
      </div> 
     </div> 
     </div> 
     <div class="c">ccc2 
     <div class="d">ddd21 
      <div class="e">eee21</div> 
      <div class="f">fff21 
      <div class="g">ggg211</div> 
      <div class="g">ggg212</div> 
      <div class="g">ggg213</div> 
      <div class="g">ggg214</div> 
      </div> 
     </div> 
     </div> 
    </div> 
    </body> 
</html> 

的DIV类=“c”的数目是一个已知的单位的整数,在这种情况下,它等于2.

我想生成文件a_1.html和a_2.html,其中每个文件分别包含div class =“c”的第一次和第二次出现。

在本例中,我想生成a_1.html和a_2.html如下:

a_1.html

<html> 
    <body> 
    <div class="a">aaa 
     <div class="b">bbb</div> 
     <div class="c">ccc1 
     <div class="d">ddd11 
      <div class="e">eee11</div> 
      <div class="f">fff11 
      <div class="g">ggg111</div> 
      <div class="g">ggg112</div> 
      <div class="g">ggg113</div> 
      <div class="g">ggg114</div> 
      <div class="g">ggg115</div> 
      <div class="g">ggg116</div> 
      </div> 
     </div> 
     </div> 
    </div> 
    </body> 
</html> 

a_2.html

<html> 
    <body> 
    <div class="a">aaa 
     <div class="b">bbb</div> 
     <div class="c">ccc2 
     <div class="d">ddd21 
      <div class="e">eee21</div> 
      <div class="f">fff21 
      <div class="g">ggg211</div> 
      <div class="g">ggg212</div> 
      <div class="g">ggg213</div> 
      <div class="g">ggg214</div> 
      </div> 
     </div> 
     </div> 
    </div> 
    </body> 
</html> 

我有一个shell脚本如下所示:

#!/bin/bash 
for i in {1..2} 
do 
    xsltproc --param occurrence ${i} a.xslt a.html > a_${i}.html 
done 

我a.xslt然而并不只提取第i个(第一或第二在这种情况下)的div类=“C”的发生。

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl:output omit-xml-declaration="yes" indent="yes"/> 
<xsl:strip-space elements="*"/> 

<xsl:param name="occurrence"/> 

<xsl:template match="@* | node()"> 
    <xsl:copy> 
    <xsl:apply-templates select="@* | node()"/> 
    </xsl:copy> 
</xsl:template> 

<xsl:template match="div[@class='a']"> 
    <xsl:copy> 
    <xsl:apply-templates select="div[@class='a']" /> 
    <xsl:apply-templates select="@* | div[@class='b'] | text()" /> 
    <xsl:apply-templates select="div[@class='c']" /> 
    </xsl:copy> 
</xsl:template> 

</xsl:stylesheet> 

我怎么能修改它,以获得正确的结果呢?

预先感谢您对您有所帮助。

+0

为什么这个标记为'xquery'如果你只对XSLT感兴趣吗? –

+1

-1的标签随之而来的误用(我已经去掉一个[标签:XQuery的]在几个小时前,并留下了通知)。不要用错了标签,应用了错误的标签警报(和苦恼)人没有在你的问题的兴趣。 –

+0

哎呀,对不起,这个网站是新手。我不知道顶栏上的通知柜台。现在我可以看到它。 – Yalmar

回答

2

如果你需要保持你目前的做法,你只需要改变的呼吁select="div[@class='c']
要:

<xsl:apply-templates select="div[@class='c'][position()=$occurrence]" /> 

但要注意: 的<xsl:apply-templates select="div[@class='a']" />apply-templates之前的属性(@*)是错误的。为此 尝试:

<xsl:template match="div[@class='a']"> 
    <xsl:copy> 
     <xsl:apply-templates select="@* | div[@class='b'] | text()" /> 
     <xsl:apply-templates select="div[@class='c'][position()=$occurrence]" /> 
    </xsl:copy> 
</xsl:template> 
+0

谢谢你缺少一块拼图:),并感谢你的指正,这是非常赞赏(我还是通过XSLT找到我的方式) – Yalmar

2

使用

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 

<xsl:param name="occurrence"/> 

<xsl:template match="@* | node()"> 
    <xsl:copy> 
    <xsl:apply-templates select="@* | node()"/> 
    </xsl:copy> 
</xsl:template> 

<xsl:template match="div[@class='c']"> 
    <xsl:variable name="pos"> 
    <xsl:number count="div[@class = 'c']"/> 
    </xsl:variable> 
    <xsl:if test="$pos = $occurrence"> 
    <xsl:copy-of select="."/> 
    </xsl:if> 
</xsl:template> 

</xsl:stylesheet> 
+0

感谢您的建议Martin。我用第一个答案的建议,但我可以看到你在那里做什么。非常感激。 – Yalmar