我是新来的Python,并且无法针对某种情况创建正确的循环。For Loop确定加权平均python
我有一个数据框dfclean
,其中包含两列:餐厅星级评分"Star_Rating"
和总评论数"Review_Count"
。
我想找到这些星级评分的加权平均数(Star_Rating *(Review_Count /评论总数)),并将它们添加到名为"weightedavg"
的新列中。
这里是我迄今为止伴随着我认为我每一步都做笔记:
#get total number of reviews
totalreviews = dfclean.Review_Count.sum()
#create empty list to append values to
weightedavg = []
#for loop
for row in range(len(dfclean)):
weightedavg.append(dfclean.Star_Rating[row] * (dfclean.Review_Count[row]/totalreviews))
#make a new column in df consisting of weightedavg
dfclean['weightedavg'] = weightedavg
任何帮助将不胜感激!
请发表一个示例DataFrame! – Alex
当然!这允许其他人确切地知道你的DataFrame是什么样的。很多时候,那些看起来不重要的事情是。 – Alex