2017-07-19 52 views
2

可能有很多不重要的边缘情况和数据噪音。我希望得到一个饼图(基于背景虚化或任何其他开源,免费的情节库),将允许看到这样的数据:一个聪明的方式来摆脱Pandas或PieChart的可视化引擎中的微不足道的数据?

type size 
S 1 
V 2 
T 200 
... 
Z 3333 

减少到其核心,有显着性(< 1%类型尺寸)噪音投入新的“其他”类型。

1)大熊猫可以自己做吗?怎么样? 2)是否有一些可视化已经与这种功能集成?

回答

2

考虑大熊猫系列a与值

import pandas as pd 
import numpy as np 
from string import ascii_uppercase 

np.random.seed([3,1415]) 
types = np.random.permutation(list(ascii_uppercase)) 
r = np.arange(1, 27) 
r = r/r.sum() 
s = np.random.choice(types, 10000, p=r) 

a = pd.value_counts(s) 

a.plot.pie(colormap='jet'); 

enter image description here


现在组的所有组与表示小于3%的计数为一组other

n = a/a.sum() 

f = n < .03 

a[~f].append(pd.Series(a[f].sum(), ['other'])).plot.pie(colormap='jet') 

enter image description here

相关问题