2017-08-16 64 views
0

我想在PySpark中只看到n个数字(例如3)的浮点数。有没有办法设置默认值?请注意,我不想整理实际的数据。如何设置PySpark中显示的默认位数?

的如下说明我已经和它是太多信息:

>>> df = sc.parallelize([ ('a', 1), ('b', 2) ]).toDF() 
>>> df.withColumn("x", rand()).show() 
+---+---+------------------+ 
| _1| _2|     x| 
+---+---+------------------+ 
| a| 1|0.7468471761178085| 
| b| 2|0.6189219219244186| 
+---+---+------------------+ 

谢谢!

回答

1

如果它仅用于显示,你可以用大熊猫,并指定一个浮点格式:

pd.options.display.float_format = '{:,.2f}'.format 
df = sc.parallelize([ ('a', 1), ('b', 2) ]).toDF() 
df.withColumn("x", rand()).limit(20).toPandas()