即时通讯使用beautifulsoup4解析网页,并使用此代码如何解决,找出两个的各个环节(Beautifulsoup,蟒蛇)
#Collect links from 'new' page
pageRequest = requests.get('http://www.supremenewyork.com/shop/all/shirts')
soup = BeautifulSoup(pageRequest.content, "html.parser")
links = soup.select("div.turbolink_scroller a")
allProductInfo = soup.find_all("a", class_="name-link")
print allProductInfo
linksList1 = []
for href in allProductInfo:
linksList1.append(href.get('href'))
print(linksList1)
linksList1打印两各环节的收集所有的HREF值。我相信这是因为它从标题以及项目颜色中获取链接。我已经尝试了一些东西,但不能让BS只解析标题链接,并且每个链接都有一个列表,而不是两个链接。我想象它真的很简单,但我很想念它。在此先感谢
make linksList1 a set()而不是list() –
非常感谢你 – Harvey