我正在处理一个小项目,并且遇到了一个问题。保留制表符后.split()
我读文件像这样(注意,原来的文件大约有40K行):
35 IMAGE:1679942 SAMD4 Sterile alpha motif domain Hs.98259 ATI146610
36 IMAGE:1700154 AI049531
37 IMAGE:1865232 AI269361
正如你可以看到,有一些细胞,其包含的信息,有些不是。 所以我希望在没有信息存储的每个单元格中,N/A。我怎样才能做到这一点? .split()确实没有这些单元格的列表。是否有解决方案,我怎样才能把所有这些水龙头在列表中即line = ["36", "IMAGE:1700154", "", "", "", "AI049531", ...]
列是否对齐?如何定义“单元格”? – 2012-08-09 09:35:29
这是一个txt文件,也没有电池的定义 也许这会有所帮助: 35 \的TImage:1679942 \ tSAMD4 \ tSterileα基序域\ tHs.98259 \ tATI146610 36 \的TImage:1700154 \ t \ t \ tAI049531 – 2012-08-09 09:36:59
所以这些列由标签'\ t'分隔吗? – 2012-08-09 09:39:30