2011-04-25 92 views
16

有人可以告诉我,如果有一个很好的(简单)的方式来形象化高维数据?我的数据目前是21个维度,但我想看看它是密集还是稀疏。有没有技术来实现这一点?有没有一种简单易用的方法来显示高维数据?

+2

我不知道答案,但是,我可以告诉你,优化这是一个非常热门的研究课题。 – 2011-04-25 13:55:09

+0

我建议使用Tableau或Spotfire等可视化工具。即使如此,21个维度是很多,所以你可能需要执行某种降维技术,以达到一个有意义的水平http://www.tableausoftware.com/public – 2011-04-25 14:54:57

回答

16

Parallel coordinates是可视化高维数据的流行方法。

什么样的可视化最适合您的数据,具体取决于它的特点 - 不同的维度有多相关?

0

星型模式。

http://en.wikipedia.org/wiki/Star_schema

可以很好地用于高维数据。

如果您的事实表的基数接近您的维度大小的乘积,那么您的数据密集。

如果事实数据表的基数小于维度大小的乘积,则表示数据稀疏。

中间有一个判断电话。

8

我会搜索的流行词是multidimensional scaling。这是一种从高维空间向下空间(2维或3维)投影的技术,其方式是在整个空间中靠近的点将在投影中靠近。

它通常用于可视化聚类算法的输出(即,如果您的群集在MDS投影中很紧凑,那么它们很可能也处于整个空间中)。

编辑:这不一定有助于确定数据是密集还是稀疏的,因为您在投影中丢失了比例尺,但它会显示它是统一的还是块状的(也许这就是您的意思)。

0

curios.IT数据浏览软件专为高维数据的可视化而设计:数据显示为3D对象(每个数据组一个)的集合,可同时显示多达13个变量。数据变量和视觉特征之间的关系比其他技术(如平行坐标)更易于记忆。

2

我一直在寻找可视化高维数据的方法,并发现这个已被有效使用的t-SNE technique。也可以帮助别人。

+0

非常垃圾看 – Cory 2017-06-15 16:04:23

+0

什么是@Cory ?当我尝试搜索我正在使用的高维数据的良好可视化和我链接的t-SNE页面时,我发现这个问题是一个很好的开源软件,我认为这会有利于其他人寻找一个 – 2017-06-15 19:10:49

+0

对不起,第一篇文章,一个链接,我瞥了一眼页面,它看起来很可信,但我看到无数垃圾帖子都是一样的。对不起,我很困惑,你可以请编辑你的文章,以便它可以让我改变投票。 – Cory 2017-06-15 19:20:28

相关问题