我希望创建一个程序,我会希望做更多的寻找确切性或更少的以下内容:一组蟒蛇
- 读取来自多个CSV文件大学的名单
- 检查是否我们已经存储的名称(即是唯一的)
- 如果已经存储,继续前进,否则就追加到一个列表
我要的是所有的特色的大学名称的列表我们到目前为止(在这一点上吨,缩写对我来说不重要),但总计名称的列表非常大。由于python集具有非常快速的查找时间,因此我在考虑首先检查名称是否在集合中,如果不是,则将该名称附加到唯一列表和集合(我还需要列表,因为订单事宜)。当你检查某个集合中是否有“in”时,那个“in”命令就像检查一个字符串是否在一个更大的字符串中一样?换句话说,在字符串比较中,“阿拉巴马大学 - 伯明翰大学”中的“阿拉巴马大学”返回True。在集合比较中,如果我测试以查看“阿拉巴马大学”是否在集合中,但是仅添加了“阿拉巴马大学 - 伯明翰大学”,它会返回true吗?如果是的话,有没有办法测试是否添加了EXACT字符串“阿拉巴马大学”而不是其他包含“阿拉巴马大学”的字符串?
'set'的行为不像'str' - 它在使用'in'比较时表现得像一个列表,即它只能用于精确匹配,没有子字符串/子列表。 – zwer
@zwer好的,谢谢 – mgrogger
我想知道为什么你不使用'OrderedDict'?另外,如果你很怀疑为什么不通过他们的ID比较字符串? –