2011-01-19 74 views
6

我正在寻找BOTS的用户代理(爬虫,蜘蛛,twitter机器人等)的完整列表。如何知道HTTP请求是否是BOT

你知道吗?

感谢

+0

这与编程有什么关系? – sbi 2011-01-19 10:39:13

+0

我需要它来过滤HTTP请求 – Himberjack 2011-01-19 10:45:55

+2

谷歌下降你住的地方?幸运的是它适用于我。在这里你可以去:[http://www.user-agents.org/](http://www.user-agents.org/)。 – 2011-01-19 10:55:51

回答

3

长话短说:你不能,没有银弹。任何机器人都可以将他们的user-agent字符串设置为'googlebot'到'spamalot'之间的任何内容。

你可以亲自看到它,你需要做的就是去Shinnok指出的第一个站点,并开始计算那里列出的所有那些Googlebot/2.X机器人。你阻止他们,他们改变机器人的名称为随机乱码等。最后,您最终会得到一个10k的机器人列表,当您尝试验证它们是否是机器人时,会减少用户的加载时间。

相关问题