2017-05-30 79 views
1

问题:

我已经看到了有关如何读取文件转换成数据帧,但无法找到一个教我使用SOH如何读取文件中的一些网站分割数据。阅读文件转换成数据框大熊猫(SOH使用拆分数据)

我得到的文件没有扩展名,但看起来像.txt文件。

现在我逐行读取文件来创建数据框,它需要很多时间。有什么办法可以让它更快吗?

代码:

from pandas import DataFrame 
openfile = open('filename','r') 
column1 = [] 
column2 = [] 
for line in openfile: 
    line = line.strip().split('\x01') #soh equals to '\x01' 
    column1.append(line[0]) 
    column2.append(line[1]) 
data = {'column1':column1, 'column2':column2} 
table = DataFrame(data,columns = ['column1','column2']) 

回答

0

如果数据没有标题,这应该这样做:

import pandas as pd 
table = pd.read_table('filename', sep='\x01', header=None, names=['column1','column2']) 

您可以后更多关于读取文件here