我们使用Google CSE(自定义搜索引擎)付费服务为我们网站上的内容建立索引。该网站主要由与包含文件组装在一起的PHP页面构建而成,但是有一些动态页面将数据库中的信息导入单个页面模板(例如新版本)。我们的问题是我可以设置数据库中的内容的过期日期,所以说“id = 2”会带来“此内容已过期”的通知。但是,如果ID 2附有上传的PDF,则PDF文件将保留在搜索索引中。当商品过期时从Google删除上传的文件
我知道我可以编写一个清理脚本,让cron运行它,查看数据库,找到过期的内容,检查是否有上传的文件被附加,并重新命名或删除它们,但必须有更好的解决方案(我希望)。
请让我知道你是否曾经遇到过这种情况,以及你的建议。
感谢, D.
我没有想过写入机器人文件...可能工作。这些文件通过上传脚本上传,并将值存储在数据库中以获取文件名。所有文件都转到同一个目录,所以像http://www.domainname.com/uploads/pdffilehere.pdf这样的路径就是路径,而“pdffilehere.pdf”将存储在数据库的“url”列中。 – Don 2010-02-21 06:53:19