Beautifulsoup noob here。只是为了练习,我试图在这里提取this page的包和版本列。我尝试使用:table = soup.find('table', attrs={'class': 'listing sortable'})
获取表格内容,但我并没有真正获得任何有价值的数据..我很迷茫。如何使用beatifulsoup提取表格列和行python
0
A
回答
2
import requests
import bs4
url = 'https://launchpad.net/~openshot.developers/+archive/ubuntu/ppa'
res = requests.get(url)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, "html.parser")
tbody = soup.find_all(id='packages_list')[0].tbody
for tr in tbody.find_all('tr'):
package = tr.find_all('td')[0].contents[2].strip()
version = tr.find_all('td')[1].contents[0].strip()
print('{0} - {1}'.format(package, version))
1
table = soup.find("table", id="packages_list")
row_data = []
for row in table.find_all("tr"):
cols = row.find_all("td")
cols = [ele.text.strip() for ele in cols]
row_data.append(cols)
我不知道是什么结果你得到的权利,但尝试了这一点!
1
可以遍历tr
标签和解压包和版本:
table = soup.find('table', attrs={'class': 'listing sortable'})
package = '' ; version = ''
for i in table.select('tr'):
data = i.select('td')
if data:
package = data[0].text.strip()
version = ' '.join(data[1].text.strip().split())
print('{} : {} '.format(package,version))
#output
libopenshot : 0.1.4+0+588+107+201703310338+daily~ubuntu17.04.1
libopenshot : 0.1.4+0+588+107+201703310338+daily~ubuntu15.04.1
libopenshot : 0.1.4+0+588+107+201703310337+daily~ubuntu16.10.1
libopenshot : 0.1.4+0+588+107+201703310337+daily~ubuntu16.04.1
...
...
相关问题
- 1. 如何使用Python以ODT(OpenDocumentText)格式提取表格,文本和图片?
- 2. 使用Python进行提取和分组
- 3. 提取HREF从属性与BeatifulSoup
- 4. 使用正则表达式和python提取编号列表(多行)
- 5. 使用python和lxml从表格中提取文本
- 6. 提取使用Python和YouTubeAPI
- 7. 提取和使用Python
- 8. 提取和使用python
- 9. 如何使用python来提取提及?
- 10. Python:使用BeatifulSoup从数据绑定中获取数据
- 11. 如何使用Python中的空格和新行将文件分割成列表?
- 12. 在BeautifulSoup中只提取表(td)中的特定行和列,python
- 13. 如何使用Python列表?
- 14. 比较2表格和仅提取表格2唯一的行
- 15. 如何在zend php中使用setDecorators创建表格行和列。
- 16. 如何使用Python提取硬件ID?
- 17. 用python提交表格
- 18. 使用csv python行和列
- 19. Python - 使用列表()和操作列表
- 20. Simplfy行和列提取,numpy
- 21. 使用python从excel表格中提取公式
- 22. 使用python从html文件中提取表格
- 23. 使用Python从NCBI页面(JS)提取表格
- 24. 使用Nokogiri提取所有表格行中的前2个表格单元格
- 25. 用python提取链序列
- 26. Python从网址提取表格到csv
- 27. python -docx从word docx中提取表格
- 28. 合并和提取列表
- 29. 使用rvest和html_nodes()和html_table提取网站表格
- 30. 如何使用Google表格API向Google表格添加下拉列表python