3
我是BeautifulSoup4
的新手,并且遇到了一个似乎很基本的问题。我只能通过身份证找到,但不能按班上课。例如,我在看它有HTML在它下面的部分站点:只能通过id找到,而不能通过班级找到BeautidulSoup4(Python3.x)
现在,以下工作:
page_soup.findAll('div', {'id': 'page-content'})
而下面发现什么:
page_soup.findAll('div', {'class': 'main-container'})
所以我的问题是:'class'与'id'属性有区别吗?如果是这样,按类名搜索的正确方法是什么?
只是为了完成,虽然我认为没关系,但我通过使用selenium
包的page_source方法获得了html。
编辑:Here是这种页面的一个例子。如果我们检查上表,包括玩家的位置,年龄等,我们会得到上面的html快照。
我假设您在发布此问题时在第二行中发生了错字? '{'class:'main-container'}' – DMan
@Dan,是的,谢谢你,修正它 – splinter
这两行应该返回至少一个标记。你能包含更多的代码和html数据吗? –