基本上,我有一个应用程序刮。 它每分钟刮n件物品。 目前我只有一个IP。刮多个IP,在java
我正在抓取的网站允许我为每个IP 3个连接。
我在考虑获得另一个IP。
所以我将能够获得6个连接。
理论上我应该可以在40秒内或多或少地获得n个物品。
目前我使用java(commons-httpcore)来完成工作。
我不确定这是java问题还是操作系统问题。
我的机器有IP 1和IP 2 我该如何连接到使用IP 1和使用IP2的www.microsoft.com, ? 我怎么能指定,我想用来做连接的IP?
是否想过你,他们限制每个IP,因为他们不想让你做这样的事情的连接数? – RHSeeger 2010-03-15 14:05:51
这是否因为这是关于网页抓取而被低估? (这不完全合法?) – 2010-03-15 14:05:54
RHSeeger说什么。 – 2010-03-15 14:11:33