我有一个数据集有超过20列,其中一个是“Trip_distance”,并有超过100,000行。如何使用python将csv文件中的列按范围和绘制直方图进行分组?
这是柱的样品 “Trip_distance”:
[0 0 0.59 0.74 0.61 1.07 1.43 0.9 1.33 0.84]
和推移。 我想通过将它们分组到一个范围中来绘制这个直方图(因为绘制所有100,000个值都没有意义)。
我试图
plt.hist(df['Trip_distance'],bins = no_of_rows)
plt.show()
但代码运行的内存。
有没有办法在Python中做到这一点?
如果您先将trip_distance列存入,然后再绘制结果? – Boud