我们使用谷歌的BigQuery星火连接器导入存储在文件拼花BigQuery内的数据忽略未知值。使用自定义工具,我们生成了BigQuery所需的模式文件,并在我们的导入代码(Scala)中引用它。谷歌的BigQuery星火连接器:如何在追加
然而,我们的数据并没有真正遵循固定和明确的架构,并在某些情况下,附加列可以被添加到个人数据集。这是使用命令行工具bq
我们几乎总是用--ignore_unknown_values
否则许多进口将失败与BigQuery实验时为什么。
不幸的是,我们无法找到使用BigQuery星火连接器com.google.cloud.bigdataoss:bigquery-connector:0.10.1-hadoop2
同等配置选项。它存在吗?
Thx用于说明。我们将考虑修补连接器。 –