2013-02-07 111 views
5

假设有三个要比较的序列:a,b和c。传统上,得到的3乘3成对距离矩阵为对称,表明从a到b的距离等于从b到a的距离。“非对称”成对距离矩阵

我在想,如果TraMineR提供了一些方法来产生非对称成对距离矩阵。

+5

我从来没有使用过TraMineR,但在侧面问题上要小心 - 如果你的测量是不对称的,那么它不再适合距离的定义。这可能是一个完全学术的观点。但是我怀疑你以后会在某种算法中使用这个矩阵,如果该算法假定你已经提供了一个距离度量标准,但实际上你并没有提供这个距离度量标准,那么可能会导致难以诊断。 – 2013-02-07 09:09:32

+2

有关如何在特定软件中执行某些操作的问题通常属于StackOverflow,因此我将此问题标记为迁移。然而,TraMineR也有自己的清单,这可能是一个更好的网站来问这个问题。 –

回答

6

不,TraMineR不会因为Pat的评论中强调的原因而产生“不对称”差异。

计算序列之间的两两相异的主要兴趣是,一旦我们有我们可以这样相异例如

  • 测量序列之间的差异,确定社区,找到中心点划分,...
  • 运行集群算法,自组织映射,MDS,...
  • 使序列
  • 增长回归树的序列方差样分析

在这些过程中输入非对称不相似矩阵很可能会产生不相关的结果。

正是由于这种对称性要求,用于计算最佳匹配距离的替代成本必须是对称的。重要的是不要将替代成本解释为从一个国家转换到另一个国家的成本,而是要理解它们的本质,即编辑成本。当比较两个序列,例如 aabccaadcc,我们可以使它们相等或者通过任意bd中的第一个或db在第二个替换。那么为两次替换提供相同的成本是没有意义的。

希望这会有所帮助。

+0

非常感谢您的好解释!然而,如果我的理解是正确的,我会找到一篇论文,其中建立了非对称成对距离矩阵,然后将其用于聚类分析。它们以某种方式为插入和删除分配不同的权重,并使用具有不对称距离矩阵的泰勒 - 布丁聚类算法。本文是由Anita Prinzie和Dirk Van den Poel编写的“通过使用元素/位置敏感SAM将顺序信息合并到传统分类模型中”。 – POTENZA