2017-09-22 45 views

回答

0

使用熊猫:http://pandas.pydata.org/

类似:

import pandas as pd 
df = pd.read_csv("your_csv_file.csv") 
top_platforms = df.nlargest(20, "Score")["Platform"] 
0

字典将是一个不错的选择,收集这样的信息:

初始化一个空字典。

对于CSV文件的每一行:

  1. 获取平台列。
  2. 如果该平台尚未在该词典中,请以1为单位创建该平台。
  3. 否则,如果它已经在字典中,请将其计数加1。

完成后,按照计数值对字典进行排序并打印前20个条目。

0

我会用大熊猫CSV文件

import pandas as pd 
from collection import Counter 
df = pd.read_csv('DATA.csv') # read the csv file into a dataframe *df* 
# create counter object containing dictionary 
# invoke the pandas groupby and count methods 
d = Counter(dict(df.groupby(['Platform'])['Platform'].count())) 

d阅读会“包含”形式的字典一个计数器对象{<platform>:<number of counts in dataset>}

你可以得到顶k最常见的平台如下:

k = 20 
d.most_common(k) 
>>> [('<platform1>', count1), 
    ('<platform2>', count2), 
    ('<platform3>', count3), 
    ('<platform4>', count4), 
    .... 

希望有所帮助。在将来,最好看到数据的头部(前几行),或者到目前为止您尝试过的代码......甚至是您使用的数据纠缠工具!