dataframe

    1热度

    1回答

    我有3个df,每个列有25个列。所有列在3 df中都是相同的。 我想合并三个df,并将25列df1的列名更改为“_a”,将25列df2更改为“_b”,将25列df3更改为“_c”。 我使用下面的代码: pd.merge(pd.merge(df1,df2,'left',on='year',suffixes=['_a','_b']),df3,'left',on='year') 如何使用重命名或其他

    0热度

    1回答

    我是R初学者,目前面临着我现在无法概念化的问题。 我已经看过几个相关的职位,但还没有发现除了有 一个明确的答案: Aggregating rows with same Ids and retaining only unique entries in R 但我的问题是有点不同。 这里的初始DF我想使用的结构: sta_RHP_metho(3528,4)的变量是: - “code.sandre” 女巫

    1热度

    3回答

    假设我有一个熊猫数据帧,其中两列由字符串列表的如下所示 df=pd.DataFrame({'A' : [ ['a','b','c'], ['d','e','f'] ], 'B':[ ['g','h','i'], ['j','k','l'] ] }) 我想连接在所述第一字符串元素在A中的第一个列表中的第一个字符串元素位于B的第一个列表中,并带有连字符等。最终的产品将是另一个C柱使 df['C']

    -1热度

    1回答

    我有以下两个数据框。 DF1: date customers 2017-10-09 8 2017-10-10 5 2017-10-11 4 2017-10-12 8 2017-10-13 9 2017-10-16 1 DF2: date manager prev_day next_day on_or_next_day 2017-10-10 george 201

    0热度

    1回答

    我有一堆数据存储在DataFrame中。我试图让用户在查询条件通过以下形式: column, operator, variable_name 所以用户可能通过在下面作为一个例子 'Action equal allow,total_bytes > 10000,application neq facebook' 我通过拆分和格式化成解析字符串看起来像这样 query_string = (dfr

    0热度

    1回答

    我想从Python中现有的csv文件创建data.frame对象,但我面临着问题。 我试图将csv文件导入python,但我不知道我是否成功。 >>> import os >>> userhome = os.path.expanduser('~') >>> csvfile= userhome + r'\Desktop\train.csv' >>> with open(

    1热度

    2回答

    我想改变我的数据框列名,我试过两种方法,但没有一个工作。 这是我的代码; 方法1: def func(): energy=pd.ExcelFile('Energy Indicators.xls').parse('Energy') energy=energy.iloc[16:][['Environmental Indicators: Energy','Unnamed:3','Un

    0热度

    1回答

    我有这样 train['finally'].head(5) 0 [0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, ... 1 [0, 0, 0, 4, 0, 0, 0, 5, 0, 0, 6, 0, 0, 0, 0, ... 2 [0, 0, 0, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, ... 3 [2, 0,

    0热度

    1回答

    非常感谢您的任何意见! 我想将数据框中的一列列表映射到分组类别。 更具体地说,我的名单列会是什么样子: List "item1|item2" "item3|item2" "item1|item3" 另外我还有一个分组类别数据帧: Category Item C1 item1 C1 item3 C2 item2 C2 item4 我想创建原数据帧新的列(列

    1热度

    1回答

    我试图用np.nan值替换我的数据框中由'...'反映的缺失值。 我也想更新一些旧的值,但我的方法似乎不工作。 这里是我的代码: import numpy as np import pandas as pd def func(): energy=pd.ExcelFile('Energy Indicators.xls').parse('Energy') energy=en