2009-06-29 52 views
2

任何人都可以告诉我什么权限我需要给MOSS 2007中的内容抓取帐户吗?MOSS搜索内容抓取帐户权限

当我运行内容的抓取时,出现一个错误,告诉我它没有权限,并且给它充分读取到Web应用程序,我试图无济于事。

所有最优秀的

+0

你只是在爬网吗?还是抓取UNC? – 2009-06-29 18:24:39

回答

1

取决于您的环境,看到这个technet article参考/洞察力,这可能与哪些组的帐户您使用的是......

0

这可能是相同的问题我碰到了,看看这个MS支持文章:

“您会收到错误401.1(拒绝访问)当您浏览的使用集成身份验证并承载于IIS 5.1或者IIS 6网站”

article

0

Colin的文章链接引用的环回错误绝对是一个很好的开始。确定回送错误是否正在播放的一种快速方法是尝试直接从托管它的服务器访问您的站点。如果你在MOSS WFE上打开IE浏览器(或者你选择的浏览器),并且可以访问该站点,那么回环漏洞并不是问题。请注意,该错误仅影响在端口80上运行的站点。

您是否看到任何其他异常?搜索爬虫帐户没有什么特别之处。它应该是一个没有特殊权限的标准用户帐户,但应在服务器场中的每个Web应用程序上为其建立完全读取Web应用程序策略。当您将帐户分配为SSP内的默认内容爬网帐户时,MOSS通常会自行处理此问题。

如果您尝试呼叫的URL的根目录下有一个或多个网站集,但实际上根网址本身没有网站集(即,级别网站集)。

例如,MOSS通常无法抓取,如果你有网站,这里将问题报告:

http://www.testurl.com/sites/samplesite

http://testserver:8000/randomsite

...但没有相应的顶级网站集在这里:

http://www.testurl.com

http://testserver:8000

如果你正试图抓取没有一个顶级网站集存在的Web应用程序,我的建议是建立一个在那里。如果没有Web应用程序中的顶级站点,许多事情就无法正常工作:InfoPath会形成发布,元数据API发布(发布到博客)等等。这些事情都尝试从根URL开始,并且当网站集不存在时,它们会失败。

如果不能创建顶级网站集,您可以使用管理路径解决该问题。更改网络应用程序的(根)管理路径从明确包含通配符包含也应该工作。

我希望这有助于!