2015-07-21 61 views
-5

我试图从本网站上抓取目录信息。 'http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478'为什么我的解析器不能正常工作

但我不知道如何选择不同的文本行,因为他们的唯一标签是换行符元素(
)。有没有一种方法可以通过文本而不是标签进行搜索?

r=requests.get('http://www.virginiaequestrian.com/main.cfm?action=greenpages&sub=view&ID=10478') 
soup=BeautifulSoup(r.content,'lxml') 
tbl=soup.findAll('table')[2] 
print tbl.br 
+3

嘛'打印tbl.br'是专门一个指令,用于打印表格中包含的'
'标签,所以我不太明白你的期望。 – JJJ

+0

你认为'print tbl.br'的输出是什么? – Krumelur

+0

伙计们,我真的很陌生,请分配责备愚昧而不是愚蠢。我希望我能得到每个单位的文本值。例如地址的第一部分。 – user3590113

回答

0

您正在查找的文本位于表格中的第二个TR中。所以,

print tbl.findAll('tr')[2] 

真的是没有的文本内部的任何良好的结构,然而,你对你自己有关获取联系人姓名等