2016-10-04 113 views
0

我在的Tableau设计可视化和我的数据是在蜂巢/ Hadoop的,而数据是巨大的,的Tableau有限的数据中提取连接速度慢

虽然我试图设计可视化,查询运行非常非常慢每次它试图从hadoop中提取数据。

所以对于任何可视化通常需要4分钟简单的拖放和可视化可能有拖拽的10秒,所以我结束了花费大量的时间等待。 我试图用数据中提取的选项,但它永远以提取数据(38分钟,并仍在继续)

问题: 有没有办法,我只能提取1000条记录,这样我就可以在这些1000条记录工作创建viz,然后在设计完成后切换到Live连接。 我想看看在画面社区的帮助,但到目前为止没有运气

回答

0

一种选项可关闭自动更新,因此不会在每次拖时间和下降重装数据:

https://onlinehelp.tableau.com/current/pro/desktop/en-us/queries_autoupdates.html

你可以尝试的另一件事是以下。在Hive中,您可以创建只有几千行的较小版本的表格。然后在表上创建一个视图并在视图处指向Tableau。根据视图设计Viz,然后在Hive中重新创建视图以指向真实表格。这可能会有帮助,但是如果Hive试图为每次拖放启动​​地图缩减作业,它仍然会令人沮丧地拖慢。

在我与经验的Tableau,你希望得到您的数据集中到一个大小,您可以使用提取选项。任何具有与Hive实时连接的交互式仪表盘都将变得缓慢。但是,如果您可以将数据集聚合到可管理的大小,那么如果执行提取,它可以很好地工作。我不再与Tableau一起工作,但过去我已经花费了30-60分钟时间提取并加载了数百万行,并且运行良好。

+0

感谢@Stephen奥唐奈,我发现了另一种方式,也发现是更快和容易。我复制了XL中的所有数据,并将我的Tableue与XL连接起来,并在几分钟内完成了我的dahsboard,由于XL和配置单元具有完全相同的fiields,我可以用Hive替换xl连接,并且它工作正常。它抱怨一些表单上的计算字段,但我想我可以在配置单元的dget周围重做那部分。 – NxC

1

复制XL中的所有数据并将我的Tableue与XL连接起来,并在几分钟内完成我的dahsboard,并且由于XL和配置单元具有完全相同的字段,我可以用Hive替换xl连接,并且它工作正常。它抱怨一些表单上的计算字段,但我想我可以在蜂房中重做那部分并绕过。