2016-11-15 137 views
1

我正在教授关于数据科学的课程,并且我不熟悉像tableau这样的工具。一位学生说,Tableau有一个非常有效的压缩算法,这对我来说有点令人震惊。我将tableau想象成类似元数据库的元素,用于可视化和探索数据。Tableau是否有内部数据库或需要外部数据库

所以主要问题是:

1)画面是否存储数据,或如何它存储数据?
2)这个数量是否有限制?
3)有没有关于压缩算法或查询速度的知识/基准?

回答

1

他们最可能指的是Tableau Data Extract。

Tableau Desktop没有内置数据库,而是连接到不同的数据源(文件,数据库等)。连接到数据源后,Tableau可以将该数据“提取”到Tableau Data Extract文件中,该文件既可以压缩又可以以列存储格式表示。

我不确定你的意思是“这个数量是否有限制?”。请记住,Tableau数据提取保存为实际文件(.tde)。

我想象的算法/代码是Tableau专有的,而不是您可以查看自己的东西。

这里是一个很好的参考,为您了解TDES:
https://www.tableau.com/about/blog/2014/7/understanding-tableau-data-extracts-part1

+0

当然,提取**是一个高效的压缩数据库,针对快速查询进行了优化(并且可能在RAM中表现最好)。因此实际限制将是基于磁盘或RAM的。 –

+0

这并不完全如此。 Tableau仍会查询提取内容,并在使用时将该查询的结果存储在RAM中 - 而不是整个提取。 – Nicarus

0

一般来说,画面不存储数据,而是指向参照一个或多个数据源仅--read - - 保留数据,发出查询,然后以可视方式呈现查询结果。它可以与几十个典型的数据源一起工作。

该架构具有优势。数据更改时,图表可以刷新以查看结果。您可以在不使用ETL的情况下合并来自多个源的数据

一个几乎例外的情况是,您按照Nicarus的解释创建了一个tableau数据提取。将提取视为原始数据源子集的永久性缓存副本。真正的数据仍然是外部的,只有一个本地速度的副本

相关问题