2012-08-07 54 views
0

几天前,我开始在一个巨大的网站上工作,这是在我之前开发的一个静态网站。如何删除网络中未看到的文件?

它是使用Dreamweaver及其模板系统制作的,但最终都是静态html + css。

我想在使用CVS之前清理网站,因此我打算删除无法从外部链接访问的文件。这包括未链接的HTML,未使用的CSS文件,未使用的图像,JavaScript和pdf,可能有一些.exe或.ppt/.pps。

有什么办法可以检查哪些文件没有被使用? (即未链接)

编辑:这个网站很大,大约10Gib在10.000个文件中。显然三分之一,没有被使用。所以解决方案将是一个自动或半自动工具。

回答

0

获取一个好的HTML编辑器,它具有查找/替换功能,可以搜索指定目录中的所有文件。 Notepad ++很好地满足了这些要求。

然后运行Find-In-Files(在NOTEpad ++中,这是ctr + shift + f)命令的文件名。小心,有时hrefs不指定目录(比如,它是从兄弟页面链接的),有时指定根目录的部分或全部路径。所以只能按文件名搜索。如果没有结果,那么没有链接。如果有结果,但其他目录中的其他文件具有相同的文件名,则需要仔细检查。

+0

没关系,但对于小型网站。我应该说,这个网站是10000个文件中的10Gib。显然三分之一,没有被使用。 – jperelli 2012-08-07 18:02:35

1

我确定有更好的方法,但我曾经使用IIS搜索引擎优化(搜索引擎优化)工具,并删除了没有出现在报告中的文件。如果您需要,它还提供其他有用的信息。

SEO Toolkit

+0

我是否需要在带有SEO工具包的IIS中托管我的网站?或者我可以从另一台电脑上使用它吗? – jperelli 2012-08-07 18:07:50

+0

我相信你唯一需要在IIS中托管的东西是SEO工具箱。当你开始测试时,如果会要求你启动一个URL并在高级选项中提供证书。尽管我一直在本地运行公用事业。 – jtimperley 2012-08-07 19:06:52

+0

另外,当您的测试在“< - 返回报告”右侧的仪表板顶部完成后,会出现一个“报告”下拉菜单,可让您下载所有网址。这将包括它遇到的每个链接文件及其状态和建议(页面,图像,JavaScript等)。 – jtimperley 2012-08-07 19:09:11