2011-07-04 26 views
5

我有一个奇怪的问题,在MS Word文档中我的documemt库没有被索引。当我查看爬行日志时,我可以看到爬网正在索引这些库本身,但没有索引它们中的任何文档。SharePoint搜索不索引文档库的内容

我检查了以下设置并将其设置为是:库设置>常规设置>高级设置>允许来自此文档库的项目出现在搜索结果中?

我还向该网站的成员组添加了“默认内容访问帐户”(因为我也想索引草稿)。没有编入索引的文件是签入和汇票的混合物。

知道包含文档库的网站使用团队网站模板,网站集已打开发布可能很有用。一切都以编程方式创建。

我拉着我的头发与这个,所以任何建议我可以检查什么或我可以如何处理这个问题将不胜感激 - 我只用了2个月的SharePoint工作,所以我仍然在学习。

TIA

+0

更新“谁可以读取项目的所有用户” - 所有这一切我创建的文档库的使用自定义从Document派生的内容类型。这是在不包含在搜索爬网中的单独网站集中定义的。也许我需要处理内容类型以使其包含在抓取中? – toby

+0

以爬虫定义的用户身份登录,看看您是否有权阅读文档。 – Nat

回答

8

检查文件夹项目是否被批准并发布。

受影响的库具有选项库设置>版本控制设置>草稿项目安全性设置为“仅限编辑项目的用户”。

我的爬网帐户确实完全控制了图书馆中的文档,并且使用爬网帐户登录以确认这一点。

当我将上述选项更改为'任何可以读取项目的用户'时,然后重置索引并进行完全爬网,这些文档在索引处进行搜索。

我以前读过,履带忽略此选项,但它似乎它以意想不到的方式interprates。

有趣(和令人沮丧的)时,我改变了“草稿项目安全性”选项,并做了一个增量嗉囊

2

确保这是在搜索服务应用程序设置服务帐户(在“的applcation管理” - >“管理服务应用程序”,在中央管理)具有正确的权限来查看文档。还要确保此帐户的权限不太高,以确保私人文档不会显示在搜索结果中。我建议设置一个名为“spsearch”的服务帐户,该服务帐户已授予内容源的读取权限。

+0

感谢您的建议。抓取用户在将文档添加到成员组时已具有读取文档的权限。您关于使账户权限不太高的建议非常有用,我需要审查。 (目前不能有1个,因为没有足够的分数)。 – toby

+0

@toby使用Web应用程序策略,爬网帐户应具有“完全读取”属性。 SharePoint 2010通常会自动执行此操作。 –

+0

感谢迈克尔,我终于找到了网络应用程序的权限,你是正确的,它已经从那里读取访问权限。谢谢。 – toby