我正在做一个网络爬虫,并且我不想用请求重载服务器,所以我会限制访问服务器的时间。在Java中,有一个集合,我可以在一段时间后才能获取元素?
我将有一个对象/集合,它是我将访问的链接列表。
我得到第一个链接,它来自Google(示例),访问并完成所有工作。我只能在20秒后(例如)从Google获取另一个链接,并在等待期间从其他域中获取链接。
总结,我需要一个集合,允许我对它内部的对象进行分类,并以确定的时间间隔从对象中获取对象。
还有一些与这类似的吗?如果不是,推荐在实施中使用哪些集合?这个集合将被各种线程访问。
这就是智能地图/缩减作业的完美例子。 – fyr