2010-07-30 108 views
7

对不起,如果我在这里遇到任何术语错误,但希望您明白我的意思。Windows Azure云存储 - 根目录中大量文件的影响

我正在使用Windows Azure云存储来存储大量的小文件(图像,每个20Kb)。

当时,这些文件都存储在根目录中。我知道这不是一个普通的文件系统,所以也许root并不是正确的术语。

我试图找到这个计划的长期影响的信息,但没有运气,所以如果任何人可以给我一些信息,我会很感激。

基本上,如果存储在这个根中的文件数量最终达到数十万/数百万,我会遇到问题吗?

感谢,

史蒂芬

+0

这回答你的问题? – Caladain 2010-07-30 14:35:37

+0

这两个回答都回答了我的问题。多谢你们。不知道我是否可以给你两个绿色的勾号,但我会尝试。 – 2010-08-02 16:39:54

回答

7

我一直在类似的情况下,我们在一个BLOB容器中存储〜10M个小文件。通过代码访问单个文件很好,没有任何性能问题。

我们遇到问题的地方在于管理代码之外的许多文件。如果您使用的是存储浏览器(VS2010或其他任何版本),我遇到的那些不支持前缀API的返回文件,您只能列出第一个5K,然后是接下来的5K等等。当你想查看容器中第125,000个文件时,你可以看到这可能是一个问题。

另一个问题是,没有简单的方法找出容器中有多少文件(这对于确切知道所有blob存储的成本是多少非常重要),而无需编写只需迭代的文件所有的斑点和数量。

这对我们来说是一个很容易解决的问题,因为我们的blob具有连续的数字名称,所以我们只是将它们分成了每个1k项目的文件夹。根据你有多少物品,你可以将这些文件夹的1K分组到子文件夹中。