2016-09-15 96 views
1

我有一张340GB的数据表,但我们只使用最后一周的数据。所以最小化成本计划将这些数据移动到分区表或分片表。Bigquery Shard vs Bigquery分区

我已经对碎片表和分区做了一些实验。我创建了分区表并加载了两天的数据(两个分区)并创建了两个分片表(独立表)。我试图拉最后两天的数据。

全表 - 27sec 分区表 - 33秒 碎片表 - 91秒

请让我知道哪条路是最好的。根据实验结果,当我对全表运行时会给出快速的结果,但全表将会扫描。

感谢,

+2

您能否提供您用于比较的两个查询?了解两个工作ID也是有用的。 (我不需要项目ID)。 –

回答

0

在性能上的差异似乎是由于已经在非分区表运行,但还没有对分区表运行(因为数据是新的)一些背景的优化。