我有一个xlsx文件,其数据列数超过1000列。我想首先解析数据文件(可以包含数字和字母)的每一列,然后从解析的数据中创建一个唯一的列表。使用Pandas创建唯一列表
我是一个完整的noob &已经尝试了“for”和“do while”循环,但都没有为我工作。
到目前为止,我有:
import pandas as pd
workbook = pd.read_excel('C:\Python27\Scripts\Data.xlsx')
worksheet = workbook.sheetname='Data'
for col in range(worksheet[0], worksheet[1300]):
print(col)
我想我需要追加的数据,也许写入一个文本文件,然后创建一个从文本文件中的唯一列表 - 我可以做的第二部分,它只是让它进入我遇到麻烦的文本文件。
感谢
对不起,当你说每隔一列你是第二列还是每一列?你也想要一些全球列表或每列列表?你有没有看过['unique'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html#pandas.Series.unique)? – EdChum
谢谢埃德,它是每个偶数列 - 0,2,4,6,8等,或者A,C,E,G,我一直到AWK。总共有1286列,所以我想列出643个列表,然后从列表中创建一个唯一列表。我一定会使用pandas.series.unique(),但我不确定如何将643列放入一个列表中。 –