我使用python 3.6和Pycharm 2016.2担任主编爬行对标签从HTML
我想爬“号”内的对内容:“TD”标签,如果“TD”标签都有一个子标签是“checked ='chedcked'”的输入标签。我试过regEx,来自BeautifulSoup和其他人的find_all,但仍然有错误消息。
请帮忙。
这是网站地址:http://www.bobaedream.co.kr/mycar/popup/mycarChart_4.php?zone=C&cno=652691&tbl=cyber
下面是我的代码:
from bs4 import BeautifulSoup
import urllib.request
from urllib.parse import urlparse
import re
popup_inspection = "http://www.bobaedream.co.kr/mycar/popup/mycarChart_4.php?zone=C&cno=652691&tbl=cyber"
res = urllib.request.urlopen(popup_inspection)
html = res.read()
soup_inspection = BeautifulSoup(html, 'html.parser')
insp_trs = soup_inspection.find_all('tr')
for insp_tr in insp_trs:
# print(insp_td.text)
th = insp_tr.find('th')
td = insp_tr.find('td')
if td.find('input', checked=''):
print(th, ":", td)
else: pass
请显示错误信息。如果我们不知道错误是什么,我们无法帮助您解决问题。 – DyZ