我一直在使用git-annex一段时间来管理我的数据,并且我发现它非常令人满意。使用git-annex管理许多小文件(〜5KB)
但是,当处理我的神经影像数据时,git annex的表现还是相当缺乏。这类数据通常包含许多图像文件(5KB),例如每个实验每个参与者约36.000个。您甚至可以看到,即使对于少数实验,我的数据存储库也可以在万亿以上的文件中累积。
有什么办法可以缓解运行时的巨大滞后git annex sync
或git annex get
?如果没有,是否有任何(大致)类似的软件可以让我管理多个神经影像数据库?