我做一些练习与数据集,像这样:列出很多词典VS词典与少数列表?
列表与许多字典
users = [
{"id": 0, "name": "Ashley"},
{"id": 1, "name": "Ben"},
{"id": 2, "name": "Conrad"},
{"id": 3, "name": "Doug"},
{"id": 4, "name": "Evin"},
{"id": 5, "name": "Florian"},
{"id": 6, "name": "Gerald"}
]
字典有几个列表
users2 = {
"id": [0, 1, 2, 3, 4, 5, 6],
"name": ["Ashley", "Ben", "Conrad", "Doug","Evin", "Florian", "Gerald"]
}
熊猫dataframes
import pandas as pd
pd_users = pd.DataFrame(users)
pd_users2 = pd.DataFrame(users2)
print pd_users == pd_users2
个
问题:
- 我应该结构是怎样的用户或喜欢users2数据集?
- 是否存在性能差异?
- 比另一个更可读吗?
- 有没有我应该遵循的标准?
- 我通常会将这些转换为熊猫数据框。当我这样做时,两个版本都是相同的......对吗?
- 每个元素的输出都是正确的,因此,如果我使用熊猫df的权利并不重要?
尼斯的问题,我将与第一个选项去,因为我侦察搜索和插入会少乏味与比较第二个 – therealprashant
只要方便使用是最重要的方面,我会选择第一个。将ID与NAME一起移动时很方便。 –
第一个版本很容易排序,而第二个版本不是。 –