2017-06-21 72 views
0

我有两列的大熊猫数据帧:使自定义电子表格与Python

year experiencesalary

我要救一个CSV文件,这两列,并在的头部有一些统计数据文件为图像中:

enter image description here

是否有任何选项与大熊猫或做我必须做一个脚本来写行添加逗号betwee任何其他库来处理这些n字段?

回答

1

可以读取该文件作为两个独立的部分(统计和CSV)

阅读统计:

number_of_stats_rows = 3 
stats = pandas.read_csv(file_path, nrows=number_of_stats_rows, header=None).fillna('') 

阅读剩余文件:

other_data = pandas.read_csv(file_path, skiprows=number_of_stats_rows).fillna('') 
+0

我想创建文件,而不是读取它。 –

2

熊猫不支持你想要什么在这里做。问题是你的格式是无效的csv。对于CSV的RFC指出每个记录位于单独的行,意味着一条线对应于一条记录,并带有一个可选标题行。您的格式会添加不符合记录的平均值和最大值。

正如我所见,你有三条路要从这里出发:i。您可以创建两个单独的数据框并将它们映射到csv文件(超精确值将为3),其中一个包含您的记录,另一个包含附加值。 II。先将数据框写入csv,然后打开该文件并在顶部插入附加值。 III。但是,如果您的目标是导入excel,@gefero的建议是正确的提示:尝试使用xslxwriter包直接写入电子表格中的单元格。