2012-04-03 59 views
0

我想对我的流视频网站做一些数据分析。为了帮助确定问题是出在我身边还是用户身上,我已经开始收集它们的流的带宽的均值和标准差。我不确定的是如何确定正常流应该是什么样子。如何检测不良视频流

找出一个正常流应该是什么样子我想找到的以下内容:

  1. 手段的均值 - 什么是正常带宽
  2. 手段STDDEV - 多少人口的带宽变化
  3. StdDevs的均值 - 有什么变化
  4. STDDEV StdDevs的正常量 - 多少平均STDDEV变化

这些统计数据是否有意义?

基本上,我试图通过寻找诸如低带宽或高度可变带宽之类的东西来检测错误的流。所以,我想我可以找到一些基线,然后寻找异常值。另外,保留每个样本的所有数据都是不可行的,所以我只能使用汇总统计。如果还有其他建议,我会记录下来,这也是一个很好的帮助。

回答

0

如果观察的数量足够大(比如> 30),只需建立一个置信区间(我在这里用α做= 0.05)

CI = [sample_mean-(sample_st.dev * 1.96)/sqrt(观察次数); sample_mean +(sample_st.dev * 1.96)/ sqrt(观测次数)]

这是一个范围,您可以确信95%样本的平均值落入。在统计表上放大您的置信区间查找z(alpha/2),并将其值替换为1.96(α= 0.05)。

P.s. 下面的参数没有太大的意义,我.. StdDevs的 均值 - 有什么变化 STDDEV StdDevs的正常量 - 多少平均STDDEV变化

+0

大,为提醒感谢。至于StdDevs的Mean,我试图检测用户速度的变化。所以,如果我随着时间的推移为同一用户提供了数据,并且他们的速度变化突然激增,则表明存在某种问题。 在这种情况下,StdDevs的Mean和StdDev我试图检测用户的平均速度是否正常的情况,但这并不一致,如果您尝试执行流式视频等操作会导致问题。 – caffein 2012-04-05 17:57:16