有人可以告诉我,如果有一个很好的(简单)的方式来形象化高维数据?我的数据目前是21个维度,但我想看看它是密集还是稀疏。有没有技术来实现这一点?有没有一种简单易用的方法来显示高维数据?
回答
Principal component analysis可能会有帮助,如果尺寸相关。
Parallel coordinates是可视化高维数据的流行方法。
什么样的可视化最适合您的数据,具体取决于它的特点 - 不同的维度有多相关?
星型模式。
http://en.wikipedia.org/wiki/Star_schema
可以很好地用于高维数据。
如果您的事实表的基数接近您的维度大小的乘积,那么您的数据密集。
如果事实数据表的基数小于维度大小的乘积,则表示数据稀疏。
中间有一个判断电话。
我会搜索的流行词是multidimensional scaling。这是一种从高维空间向下空间(2维或3维)投影的技术,其方式是在整个空间中靠近的点将在投影中靠近。
它通常用于可视化聚类算法的输出(即,如果您的群集在MDS投影中很紧凑,那么它们很可能也处于整个空间中)。
编辑:这不一定有助于确定数据是密集还是稀疏的,因为您在投影中丢失了比例尺,但它会显示它是统一的还是块状的(也许这就是您的意思)。
curios.IT数据浏览软件专为高维数据的可视化而设计:数据显示为3D对象(每个数据组一个)的集合,可同时显示多达13个变量。数据变量和视觉特征之间的关系比其他技术(如平行坐标)更易于记忆。
不知道你想从数据中看到什么样的模式。 t-SNE及其更快速的变体Barnes-Hut-SNE在高维数据的相关概念组可视化方面做得非常好。它可以通过R.
有一个简短的教程使用它对300维的高维数据。 http://www.codeproject.com/Tips/788739/Visualizing-High-Dimensional-Vector-using-T-SNE-wi
查看http://www.ggobi.org(游览,平行坐标,散点图矩阵)可用于实值变量。最近还有http://cranvas.org。 R中的游览包。
我一直在寻找可视化高维数据的方法,并发现这个已被有效使用的t-SNE technique。也可以帮助别人。
尝试使用http://hypertools.readthedocs.io/en/latest/。
HyperTools是一个用于在Python中可视化和操作高维数据的库。
- 1. 有没有一种简单的方法来显示matlab GUI中的“表”?
- 2. 有没有一种简单的方法来创建代码TextBox?
- 3. 有没有一种简单的方法来document.createElement多个元素?
- 4. 有没有一种方法来表示hibernate的数据视图?
- 5. 有没有一种简单的方法在Visual Studio中针数据提示2010
- 6. 有没有一种简单的方法来分配结构数组
- 7. 有没有一种简单的方法来显示带有Glide的图像的图像?
- 8. 有没有一种方法来读取使用数据流
- 9. 有没有一种简单快捷的方式来生成JavaScript?
- 10. 有没有一种简单的方法来实现LINQ来与DataContext对象?
- 11. 与android的editText控件有没有简单的方法来显示数字?
- 12. 有没有一种简单的方法来重复一个PHP的MySQL查询?
- 13. 有没有一种简单的方法来用Javascript创建动态变量?
- 14. 有没有一种简单的方法来用ArrayList填充微调器?
- 15. 有没有一种方法可以提高我简单的textfilter的性能?
- 16. 有没有一种方法来单元测试异步方法?
- 17. 有没有一种简单的方法来生成XML与方法摘要数据?
- 18. 有没有一种方法来格式化JLabel以显示数字的权力?
- 19. ChartJS其棒没有显示出来,简单的数据点
- 20. 有没有一种简单的方法,使工作
- 21. 有没有一种简单的方法来获取Symfony中的ServerName?
- 22. 有没有一种简单的方法来处理iPhone开发的Web服务?
- 23. 有没有一种简单的方法来跟踪Firefox变量的JavaScript变量?
- 24. 有没有一种简单的方法来模拟3D的心脏形状?
- 25. 有没有一种更简单的方法来指定intellij中的javadoc url?
- 26. 有没有一种简单的方法来突变Rust中的枚举字段?
- 27. 有没有一种简单的方法来实现WinForms中的Checked Combobox
- 28. 有没有一种简单的方法来消除tsvector中lexeme的发生?
- 29. 有没有一种简单的方法来获取URL中的URL
- 30. 有没有一种(简单)的方法来解析Python中的CRL?
我不知道答案,但是,我可以告诉你,优化这是一个非常热门的研究课题。 – 2011-04-25 13:55:09
我建议使用Tableau或Spotfire等可视化工具。即使如此,21个维度是很多,所以你可能需要执行某种降维技术,以达到一个有意义的水平http://www.tableausoftware.com/public – 2011-04-25 14:54:57