data-analysis

    0热度

    1回答

    意思是,我创建了以下数据框: availability = pd.DataFrame(propertyAvailableData).set_index("createdat") monthly_availability = availability.fillna(value=0).groupby(pd.TimeGrouper(freq='M')) 这让下面的输出 2015-08-18

    1热度

    1回答

    我试图从对角线轴的数据框获得平均 2015-08-31 2015-09-30 2015-10-31 2015-11-30 2015-12-31 \ createdat 2015-08-31 1.333333 12.555556 10.444444 5.888889 5.888889 2015-09-30 0.000000 6.777778 4.111111

    -1热度

    1回答

    我有这个(大)数据框,我想添加缺少的行(填充0)与名为“date”的列有关。 例如: date 0 1 2 3 4 5 199807 0 546.98 19355.55 1110.6 4720.34 3435.9 199808 0 1668.85 4398.29 5816.71 599.7 535.28 199809 608.79 446.68 2297.68 1

    1热度

    1回答

    我在日期变量为“YYYY-MM-DD”格式的数据框中有一个日期变量。 我在tidyr包中使用了单独的函数(下面),它可以工作,但它不会将列添加到表中。 独立的( “”,C( “年”, “月”, “日”),九月= “ - ”) 我怎样才能得到 “年”, “月” & “节”添加到表格末尾的变量?

    0热度

    1回答

    例如:数据 我想做 我需要验证什么,如果sheet1数据存在于工作表2中 例如:检查是否有IBM.N 52.35值出现在Sheet2中 由于提前

    0热度

    2回答

    匹配data.frame列我有一个假设的数据帧如下: # inventory of goods year category count-of-good 2010 bikes 1 2011 bikes 3 2013 bikes 5 2010 skates 1 2011 skates 1 2013 skates 0 2010 skis 0 2011 skis 2

    0热度

    1回答

    我正在使用子图来显示一些数字,但标签与最后一个子图相混合,所以图不具有相同的大小。而前5个并不是完美的圆圈。 这里是我的代码: for i in range(6): plt.subplot(231 + i) plt.title("Department " + depts[i]) labels = ['Male', 'Female'] colors = ['#

    2热度

    2回答

    感谢你的帮助。 我有一个看起来像这样的数据: city, room_type A, X A, Y A, Z B, X B, Y B, Y 我希望我的最终结果是这样的: city, count(X), count(Y), count(z) A, 1, 1, 1 B, 1, 2, 0 我按城市分组,我想展示的数每个城市的每个房间类型。 任何方式蟒蛇大熊猫做到这一点?谢谢。 我S

    -1热度

    1回答

    我得到了原始样本数据及其模拟数据(不问我是如何模拟的),我想检查直方图是否匹配。所以最好的方法是通过qqplot,但是statsmodels库不允许具有不同大小的样本。

    1热度

    1回答

    这里是我读取一个名为interact.csv的巨大文件(超过15个GiB)的代码,并对每行进行一些检查并根据检查结果将交互文件拆分为两个单独的文件:test.csv和trains.csv。 我的机器停下来需要两天以上的时间。有什么办法可以使这种代码更快,也许使用某种并行性? target_items: a list containing some item IDs 目前的方案: with op