3
我试图通过它们的概率索引数据(用简单的直方图估计)。目标是以小于某个阈值的概率选择系列中的项目。熊猫:索引数据的直方图结果
我有一系列的整数值,例如:
import pandas as pnd
import numpy as np
series = pnd.Series(np.random.poisson(5, size = 100))
然后我计算其直方图这样的:
tmp = {"series" : series, "count" : np.ones(len(series))}
hist = pnd.DataFrame(tmp).groupby("series").sum()
freq = hist/hist.sum()
所以现在我有每个结果的通过结果索引的频率,以及一系列结果。我现在有两个问题:
- 是否存在被结果/频率由
freq
定义的映射方式索引series
? - 如果我设法做到这一点,我该如何选择频率大于某个值的结果?
谢谢。
姆!尼斯!谢谢。 – 2012-04-16 16:27:49