BeautifulSoup newbe ...需要帮助BeautifulSoup被省略身体页的
下面是代码示例...
from mechanize import Browser
from BeautifulSoup import BeautifulSoup
mec = Browser()
#url1 = "http://www.wines.com/catalog/index.php?cPath=21"
url2 = "http://www.wines.com/catalog/product_info.php?products_id=4866"
page = mec.open(url2)
html = page.read()
soup = BeautifulSoup(html)
print soup.prettify()
当我使用URL1我得到的页面的一个很好的转储。当我使用url2(我需要的那个)。我没有身体得到输出。
<!doctype html public "-//W3C//DTD HTML 4.01 Transitional//EN">
<html dir="LTR" lang="en">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>
2005 Jordan Cabernet Sauvignon Sonoma 2005
</title>
</head>
</html>
任何想法?
我发现它在头部后面截掉了整个东西,但我不明白为什么 - 'soup'对象中没有'body'标签。 – 2009-11-09 01:36:11