pandas

-1热度

1回答

我在大熊猫数据帧以下列柱：在“统计”列，每个统计以由空格隔开。我想为每个统计信息创建新的列。问题是不是每行都有每种类型的属性。例如。第2行没有“trey”。我该如何完成这一壮举？我想这一点，但每个“后，刚添加了新列： nba_2017_revised4 = nba_2017_revised3.join(nba_2017_revised3['Stats'].str.split(' ', 7

1热度

3回答

大熊猫多指标在单柱月 - 日格式

我得有月，日的多指标，然后将数据值单列一大熊猫数据帧，看起来是这样的： Data 1 1 6 2 10 3 11 4 12 5 50 ... 12 1 3 2 4 3 10 4 11 你明白了。我已经把月份和日期分组了。我想创建一个新的列，一起格式化Month-Date。但似乎无法弄清楚。所需的

2热度

1回答

分组熊猫据帧 - 2.0

而且这个问题Grouping Pandas dataframe across rows，运是： amount clients Comp1 16.360417 Comp2 69.697501 Comp3 85.700000 Comp4 36.666667 Comp5 44.156500 如果日期列被添加到输入： tdate,client1,client2,client3,cl

0热度

1回答

在iCloud错误中未找到Python jupyter文件

我对Python（和Jupyter笔记本）颇为陌生，所以这可能是一个非常基本的问题。我目前正在尝试使用熊猫导入CSV文件中的数据，但我一直收到未找到的文件错误。我已经通过堆栈溢出几个类似的问题，但我仍然无法修复它。 DF1 = pd.read_csv（ “../文档/ septemberoctober2017jikkendata/XViewerData/20171016 /狭缝/ slitha

1热度

1回答

数据错误在大熊猫数据框中使用功能和GROUPBY工会串

，我有以下结构的数据帧：是myDF： Entry Address ShortOrdDesc 0 988 Fake Address 1 SC_M_W_3_1 1 989 Fake Address 2 SC_M_W_3_3 2 992 Fake Address 3 nan_2 3 992 SC_M_G_1_1 4 992 SC_M_O_1_1 有要在此完成

0热度

1回答

Logistic回归 - 在Python中使用分类变量？

我有一个数据集，包括7个不同的协变量和输出变量，'成功率'。我试图找到预测成功率的重要因素。我的数据集中的一个协变量是一个分类变量，它需要700个值（0-700），每个值表示它们来自的区域的ID。在进行逻辑回归时，我应该如何处理这个变量？如果我制作700个虚拟列，我怎样才能更容易地解释结果？我正在使用Python和statsmodels。

0热度

2回答

熊猫数据框：通过列名绘制颜色

我正在用一些特定颜色（由rgb值指定）绘制几行Pandas DataFrame。我正在寻找一种方法，通过将绘图线的颜色直接分配给DataFrame列名，而不是按顺序列出它们，使我的代码更具可读性。我知道我能做到这一点： import pandas as pd df = pd.DataFrame(columns=['red zero line', 'blue one line'], data=

1热度

2回答

熊猫日期时间索引的自定义显示格式？

我想显示 a DataFrame使用索引的自定义格式。我知道如何使用某种格式将DatetimeIndex转换为字符串，并且我也知道在0.17.1中引入了漂亮的styling。然而，样式机制似乎没有提供自定义格式索引本身的方式（或者我错过了什么？）。下面是一个简单的例子 In[10]: df = pd.DataFrame( index=pd.DatetimeIndex(start='2

1热度

1回答

python dataframe做类似oracle connect_by的事情？

在oracle中，我可以为父子层次结构做类似的事情。这非常方便。现在，我在大熊猫数据框做相当于现在 with tab1zx as ( select 1 as id, null as parent_id from dual union select 2 as id, 1 as parent_id from dual union select 3 as id, 2 as parent_id fro

0热度

1回答

大熊猫数据框中值不改变的功能

之外我有内部的for循环熊猫数据帧在那里我改变这样的熊猫数据框中的值： df[item].ix[(e1,e2)] = 1 然而，当我访问DF，该值仍然保持不变。你知道我到底错在哪里吗？有什么建议吗？