2016-11-28 105 views
0

到目前为止,我得到完整的页面html现在我想从该页面获取描述列表的数据。我是新的网络报废,所以请帮助我与此?如何获取描述列表的值,以及DOMXPath中的术语和描述?

这里是我想要的html。

<dl id="specs"> 

    <dt class="section">Keyboard</dt> 
    <dt>Keyboard</dt> 
    <dd>88 keys</dd> 
    <dt>Touch Sensitivity</dt> 
    <dd>Key Touch: 5 types, fixed touch</dd> 
    <dt>Keyboard Mode</dt> 

    <dt class="section">Sound Generator</dt> 
    <dt>Piano Sound</dt> 
    <dd>SuperNATURAL Piano Sound</dd> 

</dl> 
+0

其实我想要得到的

文本。 –

回答

1

你尝试

/dl[id='specs']/dt[class='section']/(dt|dd)/text() 

/dl[id='specs']/dt[class='section']/dt/text() 
/dl[id='specs']/dt[class='section']/dd/text() 

首先应该给你dt和DD标记下的所有文本节点,而后者给你的文本节点分离的DT和DD节点,如果这应该是任何意义的。

+0

它没有工作。看看我想得到dt文本然后下一个dd文本和数据后,我将存储在数据库表中。 –

+0

如果您想要做的不仅仅是获取值,请更新您的问题。用另一种方式解决 – actc

+0

问题。但仍然感谢您的帮助我 –