pandas

    -1热度

    1回答

    我在大熊猫数据帧以下列柱: ​​ 在“统计”列,每个统计以由空格隔开。我想为每个统计信息创建新的列。问题是不是每行都有每种类型的属性。例如。第2行没有“trey”。我该如何完成这一壮举? 我想这一点,但每个“后,刚添加了新列: nba_2017_revised4 = nba_2017_revised3.join(nba_2017_revised3['Stats'].str.split(' ', 7

    1热度

    3回答

    我得有月,日的多指标,然后将数据值单列一大熊猫数据帧,看起来是这样的: Data 1 1 6 2 10 3 11 4 12 5 50 ... 12 1 3 2 4 3 10 4 11 你明白了。我已经把月份和日期分组了。 我想创建一个新的列,一起格式化Month-Date。但似乎无法弄清楚。 所需的

    2热度

    1回答

    而且这个问题Grouping Pandas dataframe across rows,运是: amount clients Comp1 16.360417 Comp2 69.697501 Comp3 85.700000 Comp4 36.666667 Comp5 44.156500 如果日期列被添加到输入: tdate,client1,client2,client3,cl

    0热度

    1回答

    我对Python(和Jupyter笔记本)颇为陌生,所以这可能是一个非常基本的问题。 我目前正在尝试使用熊猫导入CSV文件中的数据,但我一直收到未找到的文件错误。 我已经通过堆栈溢出几个类似的问题,但我仍然无法修复它。 DF1 = pd.read_csv( “../文档/ septemberoctober2017jikkendata/XViewerData/20171016 /狭缝/ slitha

    1热度

    1回答

    ,我有以下结构的数据帧: 是myDF: Entry Address ShortOrdDesc 0 988 Fake Address 1 SC_M_W_3_1 1 989 Fake Address 2 SC_M_W_3_3 2 992 Fake Address 3 nan_2 3 992 SC_M_G_1_1 4 992 SC_M_O_1_1 有要在此完成

    0热度

    1回答

    我有一个数据集,包括7个不同的协变量和输出变量,'成功率'。 我试图找到预测成功率的重要因素。我的数据集中的一个协变量是一个分类变量,它需要700个值(0-700),每个值表示它们来自的区域的ID。 在进行逻辑回归时,我应该如何处理这个变量? 如果我制作700个虚拟列,我怎样才能更容易地解释结果? 我正在使用Python和statsmodels。

    0热度

    2回答

    我正在用一些特定颜色(由rgb值指定)绘制几行Pandas DataFrame。我正在寻找一种方法,通过将绘图线的颜色直接分配给DataFrame列名,而不是按顺序列出它们,使我的代码更具可读性。 我知道我能做到这一点: import pandas as pd df = pd.DataFrame(columns=['red zero line', 'blue one line'], data=

    1热度

    2回答

    我想显示 a DataFrame使用索引的自定义格式。 我知道如何使用某种格式将DatetimeIndex转换为字符串,并且我也知道在0.17.1中引入了漂亮的styling。然而,样式机制似乎没有提供自定义格式索引本身的方式(或者我错过了什么?)。 下面是一个简单的例子 In[10]: df = pd.DataFrame( index=pd.DatetimeIndex(start='2

    1热度

    1回答

    在oracle中,我可以为父子层次结构做类似的事情。这非常方便。现在,我在大熊猫数据框做相当于现在 with tab1zx as ( select 1 as id, null as parent_id from dual union select 2 as id, 1 as parent_id from dual union select 3 as id, 2 as parent_id fro

    0热度

    1回答

    之外我有内部的for循环熊猫数据帧在那里我改变这样的熊猫数据框中的值: df[item].ix[(e1,e2)] = 1 然而,当我访问DF,该值仍然保持不变。你知道我到底错在哪里吗? 有什么建议吗?