2016-08-30 108 views
0

我有1000个文件,其中数据存储在逗号分隔中。 一个文件的描述在下面给出:从熊猫读取csv文件并绘制

的值用逗号分隔,-9999值应被忽略, ,如果它可以被读取,行和列中的所有值应该存储在数字, 因为它具有用于绘图。 文件的形状是[104行×15列]。

文件的几行如下:

0, 9.8597e+00, 129.944, 1.071, 6.7433e-06, 1.0911e-05,  -9999,  -9999, 3.7134e-07, 3.5245e-05,  -9999,  -9999, 26.295, -86.822, -123.017 



0, 8.7012e+00, 130.908, 0.966, 1.9842e-06, 1.0799e-05,  -9999,  -9999, 3.5888e-07, 7.8133e-05,  -9999,  -9999, 27.140, -86.818, -122.322 

读入数值后,我需要把它绘制成插曲也。 像COl1与Col2,Col3与col5等....

任何想法如何实现它?

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

df1=pd.read_csv("small_file_106.txt",header=1) 
print(df1) 

回答

1

我从来没有使用过的情节,但下面将是第一个问题 输入有用值来na_values列表,这些将大熊猫被视为NA

pd.read_csv(File, sep=',',na_values=['-9999'],keep_default_na=False) 

而且pd.to_numeric是提供给数据一旦你已经阅读(四条的方法看起来很不错)的Seaborn library's pairplot SH将数据转换为数字

df.apply(lambda x: pd.to_numeric(x, errors='ignore')) 
0

应该生成你想要的情节。

+0

谢谢现在大部分时间都适用! – MPJ