如何分割大文件，并且在每个分割执行命令，因为它完成

操作系统：Linux如何分割大文件，并且在每个分割执行命令，因为它完成

所以我有一个情况我采用分体式，然后按通常有超过30 GB的我就2GB拆分GZ文件每个分成S3。

不幸的是，现在我运行拆分，然后当它完成时我并行移动每个拆分。

我想分割，第一部分文件完成写入后，执行push命令并对每个零件文件执行相同的操作。这将节省我的时间分配，并减少我淹没系统输出频段的时间。

无论如何，我寻找--exec或类似的东西在拆分，它只是不存在。我可以并且会写一个脚本来观察拆分目录并采取相应的行动，但我想我会问，如果任何人有一个命令已经这样做，我只是不知道。

在此先感谢。

来源

2011-03-28 BLima

属于http://unix.stackexchange.com – 2011-03-28 21:12:53

你可以使用一个循环使用dd

#gen a test file 
dd if=/dev/urandom bs=1K count=1024 of=test.bin 
sourcefile="test.bin"

这应该很容易scriptified（bash的假设）：

bsize=$((128*1024)) 
flength=$(stat --printf=%s "$sourcefile") 
for i in $(seq 0 $((($flength-1)/$bsize))); do dd if="$sourcefile" bs=$bsize skip=$i count=1 2>/dev/null; done | md5sum 

# verify  
md5sum "$sourcefile" 

for i in $(seq $RANDOM); do echo hello >> "$sourcefile"; done 
flength=$(stat --printf=%s "$sourcefile") 
for i in $(seq 0 $((($flength-1)/$bsize))); do dd if="$sourcefile" bs=$bsize skip=$i count=1 2>/dev/null; done | md5sum 

# verify  
md5sum "$sourcefile"

在我的系统中，这工作就像一个魅力，产生以下输出

1024+0 records in 
1024+0 records out 
1048576 bytes (1.0 MB) copied, 0.27551 s, 3.8 MB/s 
d73c5a920dae16861983c95d8fb1e94b - 
d73c5a920dae16861983c95d8fb1e94b test.bin 
d14ae9ae62652bc7768b076226a6320a - 
d14ae9ae62652bc7768b076226a6320a test.bin

我现在将留给您将信息传递给您的网络工作的挑战。查看mkfifo，将每个子作业重定向到一个单独的fifo，并且如果该作业具有任何值（通常bandwith是限制因素），那么可以使用xargs -PN拆分并行作业。

来源

2011-03-28 22:00:50 sehe

如何分割大文件，并且在每个分割执行命令，因为它完成

回答

相关问题