0

在我的领域中的很多文章中,这个句子已被重复:“这2个矩阵已被归一化为具有相同的平均和平方(跨所有主题和所有体素计算每种模态)”。假设我们有两个矩阵,行定义不同的主题,列是特征(体素)。在这些文章中,对标准化方法没有太多的解释。有谁知道我应该如何规范化数据有“相同平均和平方”?我根本不理解它。谢谢我怎样才能正常化数据具有相同的平方和?

+0

我不知道你的领域,也许它只是这样的:让* M1 *和* M2 *这两个矩阵,让* S1 *和* S2 *为平均和平方“ * M1 *和* M2 *分别计算* Q = S1/S2 *,将第二个矩阵的元素* M2 *除以* sqrt(Q)*。 –

+0

非常感谢。我的领域是生物医学工程,但是它并没有改变这个概念,从你的答案中我还不知道“平均和平方”的含义,你的意思是应该计算矩阵每个元素的平方,然后计算它的总和的平均值是计算吗?这是一种常用的归一化方法吗?如果这是真的,那么在这一步之后,矩阵中的负元素是如何出现的呢?似乎还需要减法?请帮帮我 –

+0

恐怕我不是真的有资格回答你的问题,你的老师/顾问肯定是一个更好的选择:)马ybe是一本关于这个主题的不同的介绍性书籍,也将有所帮助。 –

回答

0

对于在这种情况下开始规范化也被称为功能缩放,这几乎总结了它。您可以扩展功能和数据,以摆脱最终会干扰算法和结果的值的差异和值范围。

https://en.wikipedia.org/wiki/Feature_scaling

在数据处理,归一化(取决于应用)是非常有用的。例如。在基于距离的机器学习算法中,您应该对您的特征进行归一化处理,以便与算法的结果成比例地发挥作用,而与特征所包含的值的范围无关。

要做到这一点,你可以使用不同的统计测量,如广场的 总:

SUM_i(Xi-Xbar)² 

其他您可以使用方差或数据的标准差。

https://www.westgard.com/lesson35.htm#4

这些统计术语可以被用来将资料标准化,以提高例如算法的聚类质量。要使用哪个术语以及哪种方法高度依赖于您正在使用的算法和数据以及您的目标。 这里是一个文件,其中比较了,你可以从集群选择方法之一:

http://maxwellsci.com/print/rjaset/v6-3299-3303.pdf

我希望这可以帮助你一点。

相关问题