multi-dimensional-scaling

    1热度

    1回答

    假设我们有一个这样的数据帧: dat <- data.frame( a = rnorm(1000), b = 1/(rnorm(1000))^2, c = 1/rnorm(1000), d = as.factor(sample(c(0, 1, 2), 1000, replace=TRUE)), e = as.factor(sample(c('X',

    0热度

    3回答

    我早先问过“如何将两列显示为二进制(存在/不存在)矩阵?”。这个问题得到两个很好的答案。现在我想更进一步,通过物种栏向原始地点添加第三栏,以反映每个地块中每个物种的生物量。 第1列(小区)指定〜200个地块的代码,第2列(物种)指定约1200个物种的代码,第3列(生物量)指定干重。每个小区有> 1个物种,每个物种可以出现在> 1个小区。行的总数为〜2700 > head(dissim)

    2热度

    1回答

    我希望显示的文本文档的相似性我使用这scikit学习的TfidfVectorizer为tfidf = TfidfVectorizer(decode_error='ignore', max_df=3).fit_transform(data) ,然后进行余弦相似度计算作为cosine_similarity = (tfidf*tfidf.T).toarray() 它给出了相似性,但sklearn.man

    0热度

    1回答

    在我的领域中的很多文章中,这个句子已被重复:“这2个矩阵已被归一化为具有相同的平均和平方(跨所有主题和所有体素计算每种模态)”。假设我们有两个矩阵,行定义不同的主题,列是特征(体素)。在这些文章中,对标准化方法没有太多的解释。有谁知道我应该如何规范化数据有“相同平均和平方”?我根本不理解它。谢谢

    2热度

    4回答

    我在sci-kit学习中构建了一个线性回归模型,并将输入作为sci-kit学习管道中的预处理步骤进行缩放。有什么办法可以避免缩放二进制列吗?发生的是这些列与其他列进行缩放,导致值集中在0左右,而不是0或1,所以我得到的值如[-0.6,0.3],这导致输入值为0影响我的线性模型中的预测。 Basic代码来说明: >>> import numpy as np >>> from sklearn.pip

    0热度

    1回答

    我试图将MDS应用于基于分歧的距离矩阵(即它是“HSAUR”包中的“投票”数据集)。我试图将其缩小到2维并绘制没有cmdscale()函数,但是当我尝试自己做时,不能得到相同的结果。这是代码; library(HSAUR) n <- 15 deltaD = voting deltaDstar = deltaD^2 I = matrix(0,n,n) diag(I) <- 1 J

    0热度

    1回答

    如何通过R中的迭代优化实现多维缩放?有没有人有想法如何编码Guttman的变换?

    3热度

    1回答

    我想用嵌套因子制作nMDS数据图。我希望nMDS通过使用符号和颜色在一个图上显示这两个因素。 在此重现的实例中,如果被use嵌套在moisture,我想的情节,以显示作为Moisture不同的符号,然后Use为不同的颜色。 到目前为止,我已经想通了这一点: library("vegan") library("BiodiversityR") data(dune, dune.env) MDS

    2热度

    1回答

    我有一个使用sklearn.manifold.MDS函数在其上执行多维缩放(MDS)的差异矩阵。矩阵中某些元素之间的不相似性没有意义,因此我想知道是否有方法在稀疏矩阵或缺失值的矩阵上运行MDS? 根据this的问题,与0的不同点被认为是缺失值,但我在官方文档中找不到这个语句。与值0解释为非常接近的点不是相似点吗? 任何建议如何获得我的高维数据集基于稀疏相异矩阵的低维表示将受到欢迎。谢谢!

    0热度

    1回答

    我正在使用vegan包中的simper函数。简而言之,simper比较了一组组,并计算了哪些变量对它们的不相似性贡献最大,以及在给出累积贡献的名为cusum的列中计算了多少变量。输出是每个组间对比度和结果的嵌套列表。例如。 library(vegan) library(data.table) library(tidyr) data(dune) data(dune.env) sim <-