从java中的档案中获取.tsv文件而不解压档案

-2

我有一个包含8个.tsv文件的档案_2016_08_17.zip。我需要提取名为hit_data.tsv的文件并将其上传到bigquery。这些文件位于谷歌云平台上。从java中的档案中获取.tsv文件而不解压档案

有人可以给我一个简单的程序，打开存档，找到正确的文件，然后打印其行到屏幕上。我可以从那里拿走它。我的想法是用包含hit_data.tsv数据的缓冲区替换路径gs://path_name/*hit_data.tsv。

public static void main(String[] args) { 
    Pipeline p = DataflowUtils.createFromArgs(args); 

    p 
      .apply(TextIO.Read.from("gs://path_name/*hit_data.tsv")) 
      \\.apply(Sample.<String>any(10)) 
      .apply(ParDo.named("ExtractRows").of(new ExtractRows('\t', "InformationDateID"))) 
      .apply(BigQueryIO.Write 
        .named("BQWrite") 
        .to(BigQuery.getTableReference("ddm_now_apps", true)) 
        .withSchema(getSchema()) 
        .withWriteDisposition(BigQueryIO.Write.WriteDisposition.WRITE_APPEND) 
        .withCreateDisposition(BigQueryIO.Write.CreateDisposition.CREATE_IF_NEEDED)); 

    p.run(); 
}

来源

2016-08-17 Daniel Lee