我想要找到LI标签及其属性之间的span标签。试着用漂亮的肥皂,但没有运气。我的代码细节。任何一个点我的权利methodlogy 在这个验证码,我的getId函数应该返回我的id =“0_False-2” 任何一个知道正确的方法是什么? from BeautifulSoup import BeautifulSoup as bs
import re
html = '<ul>\
<li cla
我刚刚开始修补scrapy与BeautifulSoup一起,我想知道如果我失去了一些非常明显的东西,但我似乎无法弄清楚如何获得返回的文档类型来自所得到的汤对象的html文档。 考虑下面的HTML: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html lan