12
我试图解析网站,并获得与BeautifulSoup.findAll一些信息,但它并没有找到他们。我正在使用python3美丽的汤的findAll不容易找到他们所有
代码这
#!/usr/bin/python3
from bs4 import BeautifulSoup
from urllib.request import urlopen
page = urlopen ("http://mangafox.me/directory/")
# print (page.read())
soup = BeautifulSoup (page.read())
manga_img = soup.findAll ('a', {'class' : 'manga_img'}, limit=None)
for manga in manga_img:
print (manga['href'])
只打印其中的一半......
谢谢!工作! :) – Clepto 2013-05-01 20:55:36
哇。这让我不再把我的头撞在桌子上。你怎么知道lxml解析器有问题(除了显而易见的是它只返回18行)。即我应该怎么知道这是一个问题,而不是默默地有错误的行数? – FuriousGeorge 2014-03-16 17:58:32
经验;主要是通过帮助这里的人们。 – 2014-03-16 18:22:07