0
简单的年龄文件上传用java有轻微的扭曲
S3不支持流(据我所知),这样的数据需要到S3的老问题在上传之前将其分组为适当大小的文件。
在创建上面提到的这些临时文件有尽可能位置在一些指定的目录
- 本地一些选项(如果这样的事情是可能的,我不知道,从Hadoop的
- 在Hadoop集群甚至H)向HDFS
问题
- 哪一个可能会更快?
- 使用HDFS(本地或集群)还是本地FS有优势,HDFS在本质上与S3格式更接近?
技术和基础设施
EC2,LINUX,JAVA
请问我为什么不推荐HDFS? – Confused
HDFS并不是真正为此设计的,如果可能的话,在磁盘上执行所有文件操作会更快。 –
是的,最终使用本地FS并上传到S3最终压缩文件 – Confused