-2
我想从以下HTMLbeautifulsoup不提取文本
<td headers="th1" style="width: 125px;" valign="top">
<a href="https://www.dibbs.bsm.dla.mil/RFQ/RFQNsn.aspx?value=8415219212510&category=issue&Scope=" title="go to NSN view">8415-21-921-2510</a>
</td>
我用
main_page = 'https://www.dibbs.bsm.dla.mil/RFQ/RfqRecs.aspx?category=issue&TypeSrch=dt&Value=09-14-2017'
dibbssoup = BeautifulSoup(main_page.content, 'html5lib')
#grabs each rfq
containers1 = dibbssoup.find_all("tr", {"class": "BgWhite"})
NSN = container1.find("td", {"headers": "th1"}).a.get_text(strip=True)
和
NSN = container1.find("td", {"headers": "th1"}).a.text
不过我得到这个错误刮8415219212510
AttributeError: 'NoneType' object has no attribute 'get_text'
AttributeError: 'NoneType' object has no attribute 'text'
我该如何解决这个错误?
什么是BeautifulSoup对象的实际站点URL? 'container1'是'Tag'吗? –
您已经使用了'containers1',然后是'container1'。 –
无法访问您的链接。 'main_page'是一个字符串。它没有属性'.content'。您需要首先从该网址发出请求。您的代码有足够的拼写错误,难以分辨错别字是否是您错误的罪魁祸首。 –