我有导入到Google Big Query中的表格。 这些表是我的登台表,我使用视图将登台表转换为逻辑仓库表。 我的问题是代理键。对谷歌Big Query使用Farm_fingerprint
现在,ROW_NUMBER()失败,因为我的数据太大。
我一直推荐使用FARM_FINGERPRINT
是否有聘请Surrogate_key代在大查询正确的方法是什么?
谢谢
更新1的澄清。
我的一些源表中有30个记录数百万个字段。要在这里显示大。我们正在将这些记录转换成需要创建代理键以便稍后帮助BI工具的表格。
为此,我们的视图(用来替换目标表)有了转换,再加上我们使用ROW_NUMBER()函数来创建独特的代理键。我们意识到该函数会强制Big Query将整个逻辑推送到一个节点上,从而导致查询崩溃。
我们玩弄FARM_FINGERPRINT(),使用表示唯一业务键的串联字段串作为输入来检索INT64值以用作代理键。我们的信念是,这将提供一个整数,我们可以在该工具所需的BI工具中使用该整数。
我在问的是,当你有这么大的数据集时,是否有合适的方法在Google Big Query中生成基于整数的代理键?
谢谢。
如果你能提供更具体的例子将是(对你更好)比较容易回答。现在它太通用了! –
澄清 - 是否打算在桌旁放一列专用的密钥?你的桌子的模式是什么? –