mahalanobis

    1热度

    1回答

    我正在从Michael Faraway的线性模型(其中R(第11章,第160页))开始PCA部分的工作。 PCA分析对异常值敏感,Mahalanobis距离有助于我们识别它们。 作者通过绘制马哈拉诺比斯距离和卡方分布的分位数来检查异常值。 if require(faraway)==F install.packages("faraway"); require(faraway) data(fat,

    1热度

    1回答

    我有一个12x202矩阵(12个实例有202个特征)。我想计算每个12个实例之间的马氏距离,但似乎列数不能比实例数(行数)大很多。 (我不得不使用没有问题的计算12x11矩阵但超过11个特征的距离会导致错误的MATLAB要么linkage(X,'ward','mahalanobis');或mahal(X,X);或pdist2(X,X,'mahalanobis');)

    1热度

    1回答

    我想要计算每个观测值之间的数据集dat之间的Mahalanobis距离,其中每一行是一个观测值,每一列都是一个变量。这样的距离定义为: 我写的,做它的功能,但我觉得它是缓慢的。有没有更好的方法来计算R? 生成一些数据测试功能: generateData <- function(nObs, nVar){ library(MASS) mvrnorm(n=nObs, rep(0,nV

    0热度

    1回答

    我正在研究模式识别和统计。我喜欢在R中使用直接函数而不是明确编写代码。 我的问题是, 在三级2维问题,我对每一类的特征向量通常与协方差矩阵分布 s <- matrix(c(1.2,0.4,0.4,8),nrow=2) 和平均为每个类向量 m1 <- t(c(0.1, 0.1));m2 <- t(c(2.1, 1.9));m3 <- t(c(-1.5, 2.0)) 假设类同样可能, 我想分类特征向量

    2热度

    1回答

    我在R中计算了Iris数据集上的mahalanobis距离并返回了一个数值向量,其中包含150个值,数据集中的每个观察值都有一个值。 x=read.csv("Iris Data.csv") mean<-colMeans(x) Sx<-cov(x) D2<-mahalanobis(x,mean,Sx) 我尝试使用“scipy.spatial.distance.mahalanobis(U,V

    0热度

    1回答

    我有一个数据集,每个样本和25个变量有5个重复。 我想使用这些参数在所有样本之间制作一个马哈拉诺比斯距离矩阵。我使用了“mahal”函数,但是这给出了每个重复的所有距离的向量。如何制作样本间距(38 * 38)而不是矢量(1 * 190)之间的距离矩阵?

    0热度

    1回答

    我有一个8 GB的RAM和英特尔酷睿I5处理器的联想IdeaPad笔记本电脑。我每100个维度有60k个数据点。我想做KNN,为此我运行LMNN算法来查找Mahalanobis度量标准。 问题是在我的Ubuntu上运行一个空白屏幕2小时后出现。我没有得到什么问题!我的记忆变满了还是别的什么? 那么有什么方法可以优化我的代码? 我的数据集:data 我LMNN实现: import numpy as