有人可以帮我解决AWK问题吗? 我有一个像下面这样的GTF文件。第9个字段包含我想要使用的gene_id。根据另一个文件筛选文本文件(GTF)
file1.gtf
chr1 hg38_refGene exon 67127166 67127257 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077";
chr1 hg38_refGene exon 67131142 67131227 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077";
chr1 hg38_refGene exon 67134930 67134971 0.000000 - . gene_id "NR_075077"; transcript_id "NR_075077";
chr1 hg38_refGene start_codon 201283703 201283705 0.000000 + . gene_id "NM_000299"; transcript_id "NM_000299";
chr1 hg38_refGene CDS 201283703 201283904 0.000000 + 0 gene_id "NM_000299"; transcript_id "NM_000299";
chr1 hg38_refGene exon 201283452 201283904 0.000000 + . gene_id "NM_000299"; transcript_id "NM_000299";
我再有拥有所有我想从休息筛选出gene_id另一个文件。
FILE2.TXT
NM_000017
NM_000019
NM_000024
NM_000033
NM_000034
我想出去放是一个过滤的文件1与gene_id我想继续行。在python中的其他解决方案也将不胜感激。 提前谢谢!
发布最终结果 – RomanPerekhrest
以及您到目前为止所尝试的内容。 –