standard-deviation

    0热度

    1回答

    我想计算“skada”列中取决于另外三列的数据的平均值和标准偏差。我的表看起来像这样: 的 “geografi” 列有分类变量:SV,NV,男,SO,SV 的 “gradering” 列有分类变量:1,2 的“制地图”列具有分类变量:20M,康德 换句话说,这意味着我将不得不为SV,1,2-平均值和标准偏差0米; SV,2,20m; SV,1,康得; SV,2,康德; NV,1,20米......

    -2热度

    2回答

    我需要计算excel中收益率的标准差。我有一群公司的月报;可以说对于A公司,我在1995年和1996年有1到12个月,但1997年只有1到7个月。我有一组2000个公司,他们都在同一列,我不知道如何标准化公式范围根据我当年的月数而变化。

    -2热度

    1回答

    我有一个数据集。它是生物材料。我已经输入了标准偏差,我可以看到我的所有数据栏2个数据点都在平均值的3sd内。 接受均值3sd内的数据点是否在正常变化范围内? 还是依赖于数据的范围和分散?我不是数学家。只是有人试图弄清楚我是否有一个控制流程。我一直认为3sd代表95%的数据,因此这里的数据是正常分布的,不值得研究。不过,我经常被要求根据图表的外观调查2sd内的数据。 使用标准偏差时,应该在什么时候调

    0热度

    1回答

    我有一个函数来计算月收益给出的月度回报率: def monthlyreturns(df): first = df.resample('M').first().to_period('M') last = df.resample('M').last().to_period('M') return ((last-first)/first) * 100 ,所得到的DF从m

    1热度

    1回答

    我想问一个问题。我想我可以用简单的样本更好地解释。 所以,我有以下数据: Time Value 13:45 0.2 13:45 0.4 13:45 0.3 13:46 0.1 13:46 0.2 13:46 0.3 13:46 0.5 13:46 0.4 我想补充一个列。该列中的值应该是每分钟的标准偏差。所以,我想获得以下数据: Time

    1热度

    1回答

    是否有矢量化操作来计算Python DataFrame的累积和滚动标准偏差(SD)? 例如,我想添加一个'c'列,它根据列'a'计算累积SD,即在索引0中,它显示由于1个数据点导致的NaN,并且在索引1中,它计算SD基于2个数据点,依此类推。 同样的问题也在滚动SD。有没有一种有效的方法来计算,而无需迭代df.itertuples()? import numpy as np import pan

    0热度

    1回答

    有如下数据框,我想计算close列:volatility,例如window = 2,即两行的波动率。我 Date close 2010-06-09 3160.0 2010-06-10 3180.0 2010-06-11 3215.0 2010-06-14 3255.0 我用下面的代码,其使用功能: stdDeviation = pd.rolling_std(df['Close'],w

    0热度

    1回答

    我有上面的数据帧,日期&有相应信号值的时间。 我需要0 更换一次,for every 60 seconds,我需要计算mean和Std dev和与偏离很多平均值替换值,以取代所有的正值。 例如,对于前60秒,如果2017-08-23 07:49:58的值偏离了SD的偏差,则应该用平均值代替。这意味着 “59” 应由平均 替换 date-time RSSI 2017-08-23 0

    0热度

    1回答

    我有一个带有ID,日期和多个变量的面板数据集。我试图通过id列出某个日期范围内的“var1”的偏度和标准偏差。我知道这些项目是在“var1”的总结细节中,但似乎无法找到一种方法,使其按照指定的日期范围在ID中列出。 任何帮助将不胜感激!

    0热度

    2回答

    移动使用标准偏差平均值我想安装使用RandomForestRegressor因为我考虑this link import pandas as pd import math import matplotlib import matplotlib.pyplot as plt import numpy as np from sklearn.ensemble import RandomForest