0
我遇到了一些困境,我希望能指出正确的方向。仅适用于代码或数据?
我有两个(不言自明)文件夹的Git存储库:scripts
和data
。我不断在data
中添加新的数据文件进行分析,而在scripts
中,我编写了R
脚本来分析这些文件。
我跟踪两个文件夹中的更改。因此,我增加了新的数据文件到data
。这与跟踪更改无关。我只想让脚本和数据一起移动,因为我至少在两台机器上工作。 我觉得我正在使用Git,因为(相对于data
文件夹),我基本上使用它作为同步工具。
所以我的问题:使用Git也是不好的习惯?
将数据保存在回购库中的主要问题是每次更改数据时,Git都会为其创建一个新副本。如果你的数据集很大(比如说MB或GB为100),这实际上可能会导致你的回购仓库大小。如果它很小,或者你从不修改它,那么没有问题。 –