2012-04-07 57 views
0

我最近开始使用Web-Harvest作为网页抓取工具。目前,我正在一个项目的开始阶段工作,我想要验证/登录到一个网站。在开始之前,我想明确说明代码中的[URL]替换了网页的实际URL。我的web采集认证配置有什么问题?

所以,我想通过执行以下配置发布登录信息:

<config> 
    <var-def name="result"> 
     <http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&amp;server=1" multipart="true"> 
     <http-param name="login">[myusername]</http-param> 
     <http-param name="password">[mypassword]</http-param> 
    </http> 
</var-def> 
</config> 

如何检索结果信息,并按照重新的方向?手动登录时,以下扩展名将添加到URL中。似乎有某种随机化,并且还添加了一个会话标识。我想这是我需要在我的解决方案中加入的东西?

[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA 

以下是页面的来源的一部分,这可能是问题的关键。它是WebObjects问题吗?这是一个JavaScript问题?我是问题吗? :)

<body onload="document.form.login.focus();"> 
    <form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login"> 
... 
</form> 
</body> 

任何帮助是极大的赞赏。

回答

0

确保你已经得到了所有必要的PARAMS登录。它可能需要的不仅仅是密码和用户名。

+0

谢谢,就是这样。我有两个参数,我认为有预定义的值,我不必发布。 – 2013-02-07 21:07:50