multi-index

2热度

1回答

我确实有两个多索引数据帧，它们包含相同的多索引级别。它们之间的唯一区别在于索引级别的排列顺序。有没有办法从df1重新排列multiindex的级别，以便它们与df2中的一样？ df1.index.names产生 FrozenList([u'Local code', u'Nature of holding', u'Issuer long name', u' Internal Issuer rati

2热度

1回答

将两个MultiIndex级别合并为一个在Pandas中

我有一个MultiIndexed的Pandas数据框。第二级包含一年（[2014,2015]），第三级包含月份编号（[1,2，...，12]）。我想将这两个合并为一个单一的层次，例如 - [1/2014，2/2014 ...，6/2015]。这怎么能做到？我是熊猫新手。搜索了很多，但找不到任何类似的问题/解决方案。编辑：我找到了一种避免与this question的答案完全做到这一点的方法。我

2热度

1回答

在特定位置插入一个熊猫多索引数据帧到另一个多索引数据帧

我有一个parent_df和一个child_df，如下所示。 parent_df: x y colA x1 y1 A1 x1 y2 A2 x2 y1 A3 x2 y2 A4 child_df: p q colB colC p1 q1 B1 C1 p1 q2 B2 C2 p2 q1 B3 C3 p2 q2 B4 C4 我想要么修改parent_df或将child_df到p

2热度

1回答

一个大熊猫数据帧中的串联多索引的信息

我有一个多索引的数据帧象下面这样： col1 col2 col3 col4 row1 0 A A b b 1 B B c c row2 0 A B d d 1 B B e e ，并想知道例如串联信息的最有效方式对于ROW1 + COL1，ROW1 + COL2等，使得我的结果将是： col1 col2 col3 col4 row1 AB AB bc b

0热度

1回答

切片pandas.DataFrame的第二多指标

我具有形式 "a" "b" "c" #first level index 0, 1, 2 0, 1, 2 0, 1, 2 #second level index index 0 1,2,3 6,7,8 5,3,4 1 2,3,4 7,5,4 9,2,5 2 3,4,5 4,5,6 0,4,5 ... 代表点的数据帧的熊

2热度

1回答

熊猫：保存为csv时的内存差异（数据框vs多指标系列）

熊猫to_csv根据它们是多索引系列还是简单拆分的数据帧来写入大小不同的文件（后者似乎不足一半尺寸）。从csv格式可能有一些背后的直觉，但我不能弄明白。为什么熊猫系列在.csv格式上的数据帧大得多？代码，以生成一个这样的例子： # imports import pandas as pd from numpy.random import random from random import

1热度

1回答

填写丢失的DataFrame索引

给定两个熊猫数据帧dfa和dfb，我如何确保每个DataFrame的MultiIndex包含所有其他行？ In [147]: dfa Out[147]: c a b 0 5 10.0 1 6 11.0 2 7 12.0 3 8 13.5 4 9 14.0 In [148]: dfb Out[148]: c a b 0 5 10 2 7 12

2热度

1回答

熊猫DataFrame创建，访问，追加MultiIndex与不同的列类型 - SQL表格样式

我认为通过使用庞大的pandas.DataFrame库，它应该是非常简单的做所有标准的东西，你可以做一个SQL表..但考虑到许多选择后，我仍然没有找到一个好的工作解决方案。要求：表具有4列与不同的数据类型（UINT32，字符串，...），3关闭他们应该工作作为索引许多（> 10,000）的额外类型的列int8 最初我有想动态地添加行和列的想法，但结果非常慢（使用df.at [row，col]

1热度

1回答

如何从列名创建多级索引？

我想创建一个索引作为嵌入在列名中的数据的多级索引的一部分。这个问题比描述要容易得多。这是我原来的数据是这样的： d = {'time':[0,1,2], 'part_0_hits': [100,200,300], 'part_1_hits': [25,50,75]} df = pd.DataFrame(d) 我想创建一个名为“部分”已在列名零件号的新指标。结果需要看起来像这样： d2 = {

1热度

1回答

转换大熊猫多指标为datetime格式

我有熊猫一个多指标，看起来像由下面的代码生成一个： arrays = [[2001, 2001, 2003, 2004], ['January', 'March', 'June', 'December']] tuples= list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['year', 'month'])