我想从这个链接用美丽的汤
http://bet.hkjc.com/racing/pages/odds_wp.aspx?date=30-01-2017&venue=ST&raceno=2&lang=en
这里凑表数据获取特定的div元素的子元素是我的代码
from lxml import html
import webbrowser
import re
import xlwt
import requests
import bs4
content = requests.get("http://bet.hkjc.com/racing/pages/odds_wp.aspx?date=30-01-2017&venue=ST&raceno=1&lang=en").text # Get page content
soup = bs4.BeautifulSoup(content, 'lxml') # Parse page content
table = soup.find('div', {'id': 'detailWPTable'}) # Locate that table tag
rows = table.find_all('tr') # Find all row tags in that table
for row in rows:
columns = row.find_all('td') # Find all data tags in each column
print ('\n')
for column in columns:
print (column.text.strip(),end=' ') # Output data in each column
它不给予任何输出。请帮忙 !通过的javascrip产生
WHIS这是正确的,我不知道为什么你已经包含了图片,是吗? – Rishav
但是,当我使用print(table)打印数据时,它返回div元素,这意味着我们已经到达这个div表。现在我们只需要获取这个div元素的表格子元素。我们应该怎么做 ? –
@Ardour Technologies在您的浏览器中禁用JS并查看页面源代码,该代码将由'requests'返回。 –