2017-01-23 123 views
0

我需要额外的发布日期,存储在<div>从BeautifulSoup标签元素提取文本

例如,

<div class="volltextDetails"><meta content="2016-01-27T19:03:18+01:00" itemprop="datePublished"/>OTS0258, 27. Jan. 2016, 19:03</div> 

我管理与BS4找到它:

soup.find("div", {"class": "volltextDetails"}) 

但我真的无法弄清楚如何抓住其存储在meta content日期(2016-01-27T19:03:18+01:00)。

我该怎么做?

回答

1
soup.find("div", {"class": "volltextDetails"}).meta['content'] 
|----------this will return div tag---------|go to meta and get content| 

出来:

'2016-01-27T19:03:18+01:00' 

navigating-the-tree

+0

谢谢!并为链接以及。 – Zlo