2012-04-25 122 views
1

我已经上传我的数据 genotype1_large_ind_large.txt phenotype1_large_ind_large_1.txt获取运行一个Amazon EMR工作

到S3系统时,“文件不存在”的错误,并在EMR UI,我喜欢设置参数下面

RunDear.run S3N://scalability/genotype1_large_ind_large.txt S3N://scalability/phenotype1_large_ind_large_1.txt S3N://可伸缩性/ output_1phe 33 10 4

以我类RunDear.run我将分发文件genotype1_large_ind_large.txt和phenotype1_large_ind_lar ge_1.txt到缓存

然而,在运行EMR后,我收到以下错误: java.io.FileNotFoundException:文件不存在:/genotype1_large_ind_large.txt

我很奇怪,为什么有斜线'/'在文件名前面? 如何使它工作?

我还试图用像下面,但我的程序将-cacheFile作为参数,从而也不起作用,

RunDear.run -cacheFile S3N://scalability/genotype1_large_ind_large.txt#genotype。 txt -cacheFile s3n://scalability/phenotype1_large_ind_large_1.txt#phenotype.txt s3n:// scalability/output_1phe 33 280 4

回答

0

我终于意识到这是使用文件系统的问题,所以我在程序中添加了一个代码如下所示 FileSystem fs = FileSystem.get(URI.create(“s3:// scalability”),conf);