2017-10-06 125 views
0

不确定如何继续。我有一个数字列表(精确数字列表),但这些数字有一个模糊性:x,x + 1和x-1对我来说是完全一样的。但是,我想通过更改元素来最小化列表的差异。这是我认为到目前为止(带我知道这是行不通的样本名单):最小化方差python

import numpy as np 
from scipy import stats 

lst = [0.474, 0.122, 0.0867, 0.896, 0.979] 
def min_var(lst): 
    mode = np.mean(lst) 
    var = np.var(lst) 
    result = [] 
    for item in list(lst): 
     if item < mean: # not sure this is a good test 
      new_item = item + 1 
     elif item > mean: 
      new_item = item - 1 
     else: 
      new_item = item 
     new_list = [new_item if x==item else x for x in lst] 
     new_var = np.var(new_list) 
     if new_var < var: 
      var = new_var 
      lst = new_list 
    return lst 

什么功能的作用是增加1到3元。但是,当您从第4个和第5个减去1时,会出现最小差异。发生这种情况是因为我在每个项目之后最小化了方差,而不允许进行多项更改。我怎么能实现多个变化,最好是不看所有可能的解决方案(3 **如果我没有弄错)? 非常感谢

+0

你基本上要尽量减少'VAR((X +增量)%1)',其中X是你的一系列价值观。尝试使用像scipy.optimize这样的数值求解器。最后,您希望数字的最佳范围是从“delta”到“delta + 1”,您可以添加和删除数字中的整数,以确保它们都在该范围内。 –

+0

我错在使用'scipy.optimize',但我写了一个可以工作的解决方案。 –

回答

0

你可以认为这是最小化var((x + delta) % 1)找到delta的一个问题,即x你的价值观的阵列。然后你从你的值中加减整数,直到它们位于delta - 1 <= x[i] < delta的范围内。这不是delta的连续函数,所以不能像scipy.optimize那样使用求解器。但是,我们可以使用var((x + delta) % 1)的值仅在x的每个值处发生变化的信息,这意味着我们只需要测试x中的每个值作为可能的delta,并找到最小化方差的值。

import numpy as np 

x = np.array([0.474, 0.122, 0.0867, 0.896, 0.979]) 

# find the value of delta 
delta = x[0] 
min_var = np.var((x - delta) % 1) 
for val in x: 
    current_var = np.var((x - val) % 1) 
    if current_var < min_var: 
     min_var = current_var 
     delta = val 

print(delta) 

# use `delta` to subtract and add the right integer from each value 
# we want values in the range delta - 1 <= val < delta 
for i, val in enumerate(x): 
    while val >= delta: 
     val -= 1. 
    while val < delta - 1.: 
     val += 1. 
    x[i] = val 

print(x) 

对于这个例子,它发现的[ 0.474 0.122 0.0867 -0.104 -0.021 ]0.0392方差的期望的解决方案。

+0

这似乎工作,谢谢。从来没有这样想过这个问题 – bernie

0

为避免每次计算新变量(O(n²)),您可以看到当影响从xx+u的项目时,var会受到影响,如u*(u/2+x-m-u/n)

因此,这里是一个准线性时间的解决方案:

l=np.array([0.474, 0.122, 0.0867, 0.896, 0.979]) 
l.sort() 
n=len(l) 
m=np.mean(l) 
print(l,np.var(l)) 
u=1 # increase little terms 

for i in range(n): 
    if u*(u/2+l[i]-m-u/n) < 0: 
     l[i]= l[i] + u 
     m = m+u/n # mean evolution 
    else: u = -1 # decrease big terms 

print(l,np.var(l)) 

和运行:

[ 0.0867 0.122 0.474 0.896 0.979 ] 0.1399936064 
[ 1.0867 1.122 1.474 0.896 0.979 ] 0.0392256064