data-analysis

0热度

1回答

意思是，我创建了以下数据框： availability = pd.DataFrame(propertyAvailableData).set_index("createdat") monthly_availability = availability.fillna(value=0).groupby(pd.TimeGrouper(freq='M')) 这让下面的输出 2015-08-18

1热度

1回答

意味着在对角线轴在熊猫

我试图从对角线轴的数据框获得平均 2015-08-31 2015-09-30 2015-10-31 2015-11-30 2015-12-31 \ createdat 2015-08-31 1.333333 12.555556 10.444444 5.888889 5.888889 2015-09-30 0.000000 6.777778 4.111111

-1热度

1回答

如何使用某列作为参考在数据框中添加缺失行（填充0）？

我有这个（大）数据框，我想添加缺少的行（填充0）与名为“date”的列有关。例如： date 0 1 2 3 4 5 199807 0 546.98 19355.55 1110.6 4720.34 3435.9 199808 0 1668.85 4398.29 5816.71 599.7 535.28 199809 608.79 446.68 2297.68 1

1热度

1回答

如何在年，月和日中分隔日期r

我在日期变量为“YYYY-MM-DD”格式的数据框中有一个日期变量。我在tidyr包中使用了单独的函数（下面），它可以工作，但它不会将列添加到表中。独立的（ “”，C（ “年”， “月”， “日”），九月= “ - ”）我怎样才能得到 “年”， “月” & “节”添加到表格末尾的变量？

0热度

1回答

MS EXCEL - 查找/检查多个列的值在其他片

例如：数据我想做我需要验证什么，如果sheet1数据存在于工作表2中例如：检查是否有IBM.N 52.35值出现在Sheet2中由于提前

0热度

2回答

如何申请一个总结措施中的R

匹配data.frame列我有一个假设的数据帧如下： # inventory of goods year category count-of-good 2010 bikes 1 2011 bikes 3 2013 bikes 5 2010 skates 1 2011 skates 1 2013 skates 0 2010 skis 0 2011 skis 2

0热度

1回答

Matplotlib子图大小不等于

我正在使用子图来显示一些数字，但标签与最后一个子图相混合，所以图不具有相同的大小。而前5个并不是完美的圆圈。这里是我的代码： for i in range(6): plt.subplot(231 + i) plt.title("Department " + depts[i]) labels = ['Male', 'Female'] colors = ['#

2热度

2回答

Python的大熊猫GROUPBY多列

感谢你的帮助。我有一个看起来像这样的数据： city, room_type A, X A, Y A, Z B, X B, Y B, Y 我希望我的最终结果是这样的： city, count(X), count(Y), count(z) A, 1, 1, 1 B, 1, 2, 0 我按城市分组，我想展示的数每个城市的每个房间类型。任何方式蟒蛇大熊猫做到这一点？谢谢。我S

-1热度

1回答

如何在Python中的两个不同大小的样本之间创建一个qq图？

我得到了原始样本数据及其模拟数据（不问我是如何模拟的），我想检查直方图是否匹配。所以最好的方法是通过qqplot，但是statsmodels库不允许具有不同大小的样本。

1热度

1回答

Python快速读取和写入文件

这里是我读取一个名为interact.csv的巨大文件（超过15个GiB）的代码，并对每行进行一些检查并根据检查结果将交互文件拆分为两个单独的文件：test.csv和trains.csv。我的机器停下来需要两天以上的时间。有什么办法可以使这种代码更快，也许使用某种并行性？ target_items: a list containing some item IDs 目前的方案： with op