2017-06-19 95 views
0

我正在学习python并对泰坦尼克号统计数据做一些练习。该文件可以找到here。运行这个简单的代码时,我总是得到这个错误消息'字符串索引必须是整数'。 我想根据PassengerId'在我的.csv文件中找到唯一数据条目的总数。当我检查我的'test_data'变量时,它有'PassengerId',但仍然出现错误。我如何解决它?字符串索引必须是整数 - Python 3.6

import pandas as pd 

titanic_df = pd.read_csv("file.csv") 

unique_number_df = set() 

for test_data in titanic_df: 

     unique_number_df.add(test_data['PassengerId']) 

print(len(unique_number_df)) 

回答

0
titanic_df = pd.read_csv("titanic_data.csv") 

unique_number_df = set() 

for test_data in titanic_df["PassengerId"]: #here you should pass the column name. 

     unique_number_df.add(test_data) 

print(len(unique_number_df)) 
+0

尽管此代码可以回答这个问题,提供有关如何** **和额外的背景** **为什么它解决了问题,将改善答案的长期价值。 – Alexander

+0

@亚历山大感谢您的建议下次我会做。 – Pradam

相关问题