1
问题:
我已经看到了有关如何读取文件转换成数据帧,但无法找到一个教我使用SOH如何读取文件中的一些网站分割数据。阅读文件转换成数据框大熊猫(SOH使用拆分数据)
我得到的文件没有扩展名,但看起来像.txt文件。
现在我逐行读取文件来创建数据框,它需要很多时间。有什么办法可以让它更快吗?
代码:
from pandas import DataFrame
openfile = open('filename','r')
column1 = []
column2 = []
for line in openfile:
line = line.strip().split('\x01') #soh equals to '\x01'
column1.append(line[0])
column2.append(line[1])
data = {'column1':column1, 'column2':column2}
table = DataFrame(data,columns = ['column1','column2'])