2017-04-17 68 views
2

我正在使用Sphider与Sphider搜索引擎“URLs必须包含”的问题

我想允许蜘蛛离开我的域名http://www.example.com,但只爬行/访问包含example的网址。意味着只有像http://www.example.comhttp://www.my-example.comhttp://www.test.example.com应该被访问/索引但不是http://www.exa-mple.com

阅读manual后,我尝试了以下内容:Screenshot of what I tried.

但试图索引时,我得到这个消息:Image: What I'm getting when trying to index.

谁能帮我。我究竟做错了什么?我也已经试过*example*但这也没有奏效。

+0

你只需要'*/example /',但是如果你对检查上下文不感兴趣,为什么不在必须包含列表中使用简单的单词'example'? –

+0

@WiktorStribiżew感谢您的评论。我会尽力。 – David

回答

3

documentation包含一个误导例如:

每串起始部分前'*'被认为是一个正则表达式,以便'*/[a]+/'表示被一个或多个在其中的的一个字符串。

[...]字符类匹配从它里面确定了一系列/范围内的任何单个字符。

您可以使用*/example/来定义匹配example字符串的正则表达式。 但是,如果您对检查上下文不感兴趣,则最好在必须包含列表中使用example字符串。

+1

感谢您的回答。它对我非常有帮助。谢谢! – David