multi-index

    2热度

    2回答

    我有两个dataframes df1和df2: In [56]: df1.head() Out[56]: col7 col8 col9 alpha0 D0 alpha0 D0 alpha0 D0 F35_HC_531d.dat 1.103999 1.103999 1.364399 1.358938 3.171808 1.946894

    1热度

    2回答

    我有一个3维numpy数组,(z, x, y)。 z是时间维度,并且x和y是坐标。我想将其转换为多索引pandas.DataFrame。我希望行索引是z维 ,并且每列都具有唯一x,y坐标的值(因此,每列都将被多索引)。 最简单的情况下(不是多索引): >>> array.shape (500L, 120L, 100L) >>> df = pd.DataFrame(array[:,0,0])

    0热度

    1回答

    我有两个表具有相似的多指标结构:date和country__name。索引不完全相同:某些国家可能从一个或另一个表中缺失。 表格有不同的列。为了说明,在这里,他们是: 我想将它们合并成保持多指标,但拥有所有来自两个表的列一个表。 但是当我做 pandas.concat([grouped_channel_df, grouped_tds_df], axis=1) 我得到一个完整的NaN表: 我缺少

    0热度

    1回答

    假设我有在Matlab多维元素说 M=rand(5,4,3) 其中5行代表说,客户的姓氏和4列代表他们的{年龄,体重,活动,幸福水平},而其他3个多矩阵代表多年{1999,2003,2009}。 我试图将其转换为Pandas中的多索引数据框架。可以请别人帮我吗?

    0热度

    2回答

    在问这里之前尝试了很多事情。感谢任何帮助。 我有两个数据框是聚合函数的产物,我想合并在一起并能够根据多索引级别进行排序。 这里是什么样子的外观: Serial year quarter min median mean max 0 #474331000 2014 2 2350000 2350000 2.350000e+06 2350000 1 #484110AD1 2014 2

    0热度

    1回答

    我有一个MultiIndex问题。我使用第三方软件包,以MultiIndex格式传递我的股票价格和市盈率。我想要做的是迭代地为每个代码行添加两个新列,它们计算PE比值的平均值和标准值。 粗糙的数据结构可以用这个代码被复制: arrays = [['GOOGL US Equity','GOOGL US Equity','IBM US Equity','IBM US Equity'],['LAST_P

    0热度

    1回答

    我有两个矩阵:numpy方阵和一个熊猫多指数方阵。它们的尺寸相同。这个想法是将numpy的价值转化为多索引熊猫矩阵,以更轻松地导航到数据中。 我的矩阵大概是100 000 x 100 000. 而我的熊猫矩阵有三级索引。 tuples = [('1','A','a'), ('1','A','b'), ('1','A','c'), ('1','B','a'), ('1','B','b'), ('1'

    0热度

    1回答

    设置: 我有一个多指标数据帧数据这样; value date date 2015-08-13 00:00:00+10:00 2015-08-13 06:30:00+10:00 0.812689 2015-08-13 15:30:00+10:00 0.054290 2015-08-13 16:00:00

    2热度

    1回答

    这应该是一件简单的事情,但经过几个小时的搜索后,我仍然对我做错的事情感到不知所措。 我试过不同的方法使用MultiIndexing.from_和多个其他的东西,但我不能得到这个权利。 我需要这样的东西: 而是我得到: 我在做什么错? import pandas as pd list_of_customers = ['Client1', 'Client2', 'Client3'] stat_i

    0热度

    1回答

    我有一个带有多索引的Pandas数据框。等级0是'应变',等级1是'JGI库'。每个“Strain”都有几个与之关联的“JGI库”列。我想使用lambda函数来应用t检验来比较两个不同的菌株。为了排除故障,我使用.iloc [0]命令占用了一行数据帧。 row = pvalDf.iloc[0] parent = 'LL1004' child = 'LL345' ttest_ind(row.g