什么是从字符串数组像这样得到的最简单的方法:字符串数组用字列数据帧
arr = ['abc def ghi', 'def jkl xyz', 'abc xyz', 'jkl xyz']
的数据帧,其中每列是一个字,每行包含0或1,具体取决于如果该字出现在字符串中。事情是这样的:
abc def ghi jkl xyz
0 1 1 1 0 0
1 0 1 0 1 1
2 1 0 0 0 1
3 0 0 0 1 1
编辑:这里是我的方法,这对我来说似乎是一个很多蟒蛇循环,而不是使用内置的大熊猫功能
labels = (' ').join(arr)
labels = labels.split()
labels = list(set(labels))
labels = sorted(labels)
df = pd.DataFrame(np.zeros((len(arr), len(labels))), columns=labels)
cols = list(df.columns.values)
for i in range(len(arr)):
for col in cols:
if col in arr[i]:
df.set_value(i, col, 1)
抱歉,本网站不是为了解决您的任务,而是为了解决您在解决问题时出现的问题。 那么,你的代码到目前为止看起来如何? –
我在问题中包含了我自己的代码,该代码可行,但看起来像很多手动Python循环。我想可能有更简单的方法来做到这一点熊猫 – pietz