2017-10-04 48 views
0

我正在创建机器学习模型文件,其大小可以为几GB。将它们签入存储库需要一些时间。将这些文件存入存储库是否是一种好的做法?事实是,这些模型文件必须是应用程序的集成部分。谢谢你的建议。我应该检查大型模型文件到git存储库吗?

回答

1

如果你真的需要那么版本的文件中,您最有可能正在寻找的Git LFS:https://git-lfs.github.com/

Git的大文件存储(LFS)取代大的文件,如音频 样本,视频,数据集和图形在Git中使用文本指针, ,同时将文件内容存储在GitHub.com或 GitHub Enterprise等远程服务器上。

但是,如果它不改变太多,那么也许只是让下载

+0

Git LFS是商业吗? – marlon

+0

看到我链接到的网站? –

0

还有其他的方法来做到这一点,虽然。如果模型文件真的很大(我假设神经网络?!),另一种方法可能是使用类似于配置文件的东西,该文件指向存储该模型的生产服务器上的特定位置。 然后,您可以手动复制模型文件(如果模型没有每天更新),或者编写一个脚本来为您更新已部署的模型。 然后,您可以将配置文件存储在git仓库中(非常小),但您仍然可以定义特定的模型。

相关问题