0
我有一个应用程序每天或每小时或者随机地向S3写入数据,另一个应用程序将数据从S3读取到本地HBase。有没有什么办法可以告诉最后一次更新上传的文件是什么,然后再读取文件,换句话说,增量复制文件?将文件从S3增量复制到本地hdfs
例如: 第1天:App1将文件1,2,3写入文件夹1; App2将这3个文件读取到HBase; 第4天:App1写入文件4 & 5至文件夹1,6,7,8至文件夹2; APP2需要从文件夹中读出从文件夹1 4 & 5,然后6,7,8 2.
感谢