我需要替换'|'到标签中,以便我可以分析我的人类注释基因组数据(200 + mb)。我是一位研究助理,学习如何以最简单/最简单的方式分析/操纵测序数据,以便我可以在更多数据上复制这些数据。python改变'|'到标签delimenated
这里我的数据是怎样的。在一个文件中有大约400,000行这种类型的数据。
ANN=C|downstream_gene_variant|MODIFIER|OR4G4P|ENSG00000268020|transcript|ENST00000606857|unprocessed_pseudogene||n.*1414T>C|||||1414|,C|intron_variant|MODIFIER|OR4G4P|ENSG00000268020|transcript|ENST00000594647|unprocessed_pseudogene|1/1|n.20-104T>C||||||;DP=11;SS=1;VT=SNP
我试图用这段代码来替换'|'转换成'\ t'几行。
import csv
infile = 'Book2.xlsx'
with open(infile , 'r') as inf:
for line in inf:
w =csv.writer(inf, delimiter = '\t')
print w
所有我得到是这样的:
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
<_csv.writer object at 0x7f8beebaafc8>
的'csv'模块不能读写Excel格式'.xlsx'文件,只有包含字符分隔值的文本文件。有许多Python的第三方模块可以处理Excel文件,所以你需要使用一个(尽管理论上你可以编写自己的模块)。其次,即使'csv'确实支持这种格式,您的代码也会为它读取的每一行输入文件创建一个新的'csv.writer'_class instance_,这就是您显示输出的原因。 – martineau