我有一个脚本,输出多列,它们之间放置在一起。我希望将这些列合并在一起并删除重复项。我试过合并,合并,连接和加入,但我似乎无法弄清楚。我也尝试合并为一个列表,但这似乎也没有帮助。以下是我的代码:在熊猫中合并列
import pandas as pd
data = pd.ExcelFile('path')
newlist = [x for x in data.sheet_names if x.startswith("ZZZ")]
for x in newlist:
sheets = pd.read_excel(data, sheetname = x)
column = sheets.loc[:,'YYY']
任何帮助真的很感激!
编辑
关于代码的一些更多的信息:数据就是一个excelfile被加载。然后在新列表中显示以ZZZ开头的工作表名称。然后在for循环中调用这些表单。在列,名为YYY的列被调用。这些列被放置在彼此之下,但尚未合并。例如: Here is the output of the columns now我想让他们成为1到17的一个列表。
我希望现在更清楚!
编辑2.0
在这里,我试图是下面提到的concat方法。不过,我仍然得到输出如上图所示,而不是从1到17
my_concat_series = pd.Series()
for x in newlist:
sheets = pd.read_excel(data, sheetname = x)
column = sheets.loc[:,'YYY']
my_concat_series = pd.concat([my_concat_series,column]).drop_duplicates()
print(my_concat_series)
如果没有向我们展示您的数据是什么样的,您希望得到什么帮助? –
当你说“我想列合并在一起”,你能举个例子吗?很难知道我们如何解决这个问题,因为它很不清楚。 – ysearka
是的,很抱歉,会做。我会编辑这个问题! – Cucumber12