2010-02-11 77 views

回答

5

它们是数字character entities,试图欺骗蜘蛛,使其看不到电子邮件地址形式的“mailto”或字符。而作为一种反收获策略,它可能从1997年左右开始无效。 :-)

+0

由于大多数语言现在都有像PHP的html_entity_decode()这样的本地函数,它们可以在这些实体和真实字符之间进行匹配,所以还没有工作。 – jpabluz 2010-02-11 14:52:58

+0

@jpabluz:的确如此。蜘蛛解释实体,然后扫描结果字符串。 – 2010-02-11 14:53:58

0

此:

<a href="&#109;&#x61;... &#111;&#x6d;">&#x63;&#x74;... e&#115;&#x73;</a> 

使得用于电子邮件收获比其对应部件也有点困难:

<a href="mailto:[email protected]'>contact</a> 

然而,也有办法,甚至解密所以这不是在实践中非常有用:(

1

它假定spambot蜘蛛把网页作为文本对待正则表达式匹配而不是执行最基本的HTML解析