2017-09-25 243 views
0

我的目的是遍历页面,通过点击每个页面,然后从中获取一些信息。我使用硒作为Python。我的问题是,我无法找到任何链接/ href,我应该点击HTML中的页面。通过html中的页面迭代

这就是HTML的样子。我找到了pageNum的列表,但是当我点击它们时,出现错误。当我更仔细地查看HTML时,发现我没有并链接到那里。那我该怎么办?

正如你可以看到,下面,我添加了一些更多的HTML,“表单方法”。我也在HTML中找到它。也许它会有所帮助。当我比较页面的不同href时,它们由这个模块组成。

<a class="pageNum" rel="1" >1</a> 
<a class="pageNum" rel="2" >2</a> 
<a class="pageNum" rel="3" >3</a> 
<a class="pageNum" rel="4" >4</a> 
<a class="pageNum" rel="5" >5</a> 
<a class="pageNum" rel="6" >6</a> 
<a class="pageNum" rel="7" >7</a> 
<a class="pageNum" rel="8" >8</a> 
<a class="pageNum" rel="9" >9</a> 
<a class="pageNum" rel="10" >10</a> 
<a class="pageNum" rel="11" >11</a> 
<a class="pageNum" rel="12" >12</a> 
<a class="pageNum" rel="13" >13</a> 
<a class="pageNum" rel="14" >14</a> 
<a class="pageNum" rel="15" >15</a> 


<form method="get" id="searchParams" action="https://www.ida.org.il/"> 
    <input type="hidden" name="pageType" value="19"/> 
    <input type="hidden" name="langId" value="1"/> 
    <input type="hidden" name="currPage" value="20"/> 
    <input type="hidden" name="paramIds" value=",321,322,354,355,320"/> 
    <input type="hidden" name="scope" value=""/> 
    <input type="hidden" name="parameterSearch" value=""/> 
</form> 

这里是网站:https://www.ida.org.il/?pageType=19&langId=1&paramIds=%2Con_321%2Con_322%2Con_354%2Con_355%2Con_320&scope=&parameterSearch=

下面你可以看到,我想重复的列。

+0

单击手动执行操作时单击的元素。 – Guy

+0

元素是“pageNum”,但正如您从附加的html中看到的那样,没有href/link。也许有Java Script功能,当我点击“pageNum”时创建href。 –

回答

0

即使没有href属性,您仍然可以单击页码并重定向。使用rel属性

page_number = 2 
driver.find_element_by_css_selector('[rel="' + page_number + '"]').click() 
+0

我有page_number问题。这是一个数字,我应该把那里的字符串。 Python给我写了一个错误。 –

+0

@KDDExpert,所以只需使用字符串,而不是'page_number ='2'' – Guy