2017-06-01 55 views
0

我试图使用beautifulsoup在以下链接表来分析数据属性,beautifulsoup分析表在Python

http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch

由于该表中没有阶级属性或ID ,我无法使用soup.find(“table”,{“title”:“TheTitle”})的常规方法来查找表格。相反,我已经尽力了,

warrantUrl = 'http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch' 
warrantPage = urlopen(warrantUrl) 
soup = BeautifulSoup(warrantPage, 'html.parser') 
table = soup.find_all("tr") 
paragraphs = [] 
for x in table: 
    paragraphs.append(str(x)) 

另外,我想在这个岗位, Parse table with BeautifulSoup Python提到的方法。但没有成功...

回答

0

该网站使用javascript,BeautifulSoup无法将其转换为html,它无法处理它,urllib也不能,你需要检查出Ghost for python。

http://jeanphix.me/Ghost.py/

阅读文档,它真的很简单,功能强大,类似的请求。它有能力“评估”JavaScripts并以各种方式返回它们的值。

+0

谢谢你,会研究那一个。 – ppp5000

+0

检查一下,如果你需要任何帮助,请不要犹豫,问问 –