0
我最近开始使用Web-Harvest作为网页抓取工具。目前,我正在一个项目的开始阶段工作,我想要验证/登录到一个网站。在开始之前,我想明确说明代码中的[URL]替换了网页的实际URL。我的web采集认证配置有什么问题?
所以,我想通过执行以下配置发布登录信息:
<config>
<var-def name="result">
<http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&server=1" multipart="true">
<http-param name="login">[myusername]</http-param>
<http-param name="password">[mypassword]</http-param>
</http>
</var-def>
</config>
如何检索结果信息,并按照重新的方向?手动登录时,以下扩展名将添加到URL中。似乎有某种随机化,并且还添加了一个会话标识。我想这是我需要在我的解决方案中加入的东西?
[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA
以下是页面的来源的一部分,这可能是问题的关键。它是WebObjects问题吗?这是一个JavaScript问题?我是问题吗? :)
<body onload="document.form.login.focus();">
<form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login">
...
</form>
</body>
任何帮助是极大的赞赏。
谢谢,就是这样。我有两个参数,我认为有预定义的值,我不必发布。 – 2013-02-07 21:07:50