2017-09-26 84 views
0

有没有人在这里知道如何在google数据准备中导入json文件? 我可以上传一个json文件,但它不能创建列。在google dataprep中导入json文件

这里是截图:enter image description here

,你可以看到它显示所有的JSON成1列。

我做了一些研究,看来,我认为JSON应与其他步骤

这里得到支持是文章: https://cloud.google.com/dataprep/docs/html/Supported-File-Formats_57344528

,这里是额外的步骤文章: https://cloud.google.com/dataprep/docs/html/Splitrows-Transform_57344654

我曾尝试拆分行,但它仍然无法正常工作。有什么特殊的JSON格式我必须使用?

会很好,如果你能给我一个json文件的简单例子,按预期工作。

谢谢。

回答

0

找到了答案。

示例数据:

{"name":"jonSnow","age":21,"dob":"1988-01-01","tags":["a","b"],"address":{"postcode":3122,"state":"vic"}} 
{"name":"aom","age":21,"dob":"1988-02-01","tags":["c","d"],"address":{"postcode":3000,"state":"Vic"}} 

当它已被添加作为一个数据集,这些步骤如下:(这个已经由默认由dataprep建议的)

  1. 分割行。

    splitRows分离西:COLUMN1上: '\ n' 名言: '\ “' quoteEscapeChar: '\”'

  2. 使用创建列未

    UNNEST西:列1键: '名','年龄”,‘出生日期’,‘标签’,‘address.postcode’,‘address.state’

据我了解,谷歌的数据准备将收到您的JSON作为一个字符串。所以这取决于你如何导入数据集。

+0

@hhanarusdy是应该为每个键创建一个充满相关值的列吗?它似乎没有与我的工作,只是创建一个与密钥名称但空值的列 –

+0

对我来说它也没有意义。无论如何,由于某些限制,我们取消了使用数据准备的计划。因为数据准备数组的结果将以字符串结果。 你不必自己创建列,一般dataprep会建议一些步骤。 – hnandarusdy