1
我有这个源:Python的27 - BeautifulSoup和表
<tr id="bitstampUSD">
<td class="arrow" change="up" latest_trade="1363480722">
<span class="down">▼</span>
</td>
<td class="symbol">
<nobr>
<a href="/markets/bitstampUSD.html">bitstampUSD</a>
</nobr>
<span class="sub">USD (SEPA converted)</span>
</td>
<td>46.74
<span class="sub">41 min ago</span>
</td>
<td class="minichart break">
<span volume="**whole heaps of number here that I want**"
print="**more numbers I want**"
avg="**more numbers I want**"
class="marketsparkline"></span>
</td>
<td>**36.39**
<span class="sub change">**10.35 28.46%**</span>
</td>
<td>**141,043.10**
<span class="sub">**5,132,052.22 USD**</span>
</td>
<td>**25.25**
<span class="sub">**46.58** (24h)</span>
</td>
<td>**49.17**
<span class="sub">47 (24h)</span>
</td>
<td class="break">**46.7**</td>
<td>**46.74**</td>
<td class="break">**46.78**
<span class="sub change">-0.04 -0.09%</span>
</td>
<td>**819.54**
<span class="sub">**38,340.96** USD</span>
</td>
</tr>
所以我想以粗体显示的数据。 (嗯,它应该是粗体,我猜代码标签可以阻止这种情况的发生。两个星号内的数据。
我设法弄清楚如何获取代码中的位,因为它是在班级里面的,但是这里有一些在班级之外,所以我不知道如何去抓它
如果你想要看整个来源可能有帮助http://bitcoincharts.com/markets/ 它的布局不同于我之前见过的其他表代码。
'soup.findAll( 'B')'? – TerryA 2013-03-17 01:48:19
而不是摆弄HTML解析,使用[市场API](http://bitcoincharts.com/about/markets-api/)会不会更容易?我只是自己试了一下,它返回了一个很好的JSON编码的字典列表,其值为'[{u'volume':822.42673038,u'latest_trade':1363486862,u'bid':46.81,u'high':47.0 ,u'currency':u'USD',u'currency_volume':38473.8713986671,u'ask':46.83,u'close':46.81,u'avg':46.78091066044309,u'symbol':u'bitstampUSD',u '低':46.58}]'。 – DSM 2013-03-17 02:40:47
哦,该死的!哈哈,我想,无论如何我都想知道,但如果失败了,我会看看那个,欢呼。 – tommo 2013-03-17 02:43:06