2017-04-07 91 views
2

在Google Big Query中,如果我对视图运行查询,它会告诉我扫描了多少数据以回答它。 (作为此功能的BQ账单)。Google Big Query data measurement

但是有没有办法查看我在BQ环境中有多少数据,而无需查询项目中存在的任何许多视图?我的目标是每天测量BQ中的数据量。下面

+0

是否要获取每个单个表的数据集大小或存储大小? – Tushar

+0

为了赞美米哈伊尔的回答,还有这个漂亮的小工具 - http://bqdu.info/ –

+0

@Tushar,目标是每天测量数据集的大小。作为一个相关的问题,是否有一个查询会显示项目下的所有对象?我可以在左边的UI中看到它们(在我的例子中是一串8位整数标识符),但想知道是否可以使用编程查询来获取它们。 –

回答

4

希望会给你如何快速检查库存的具体数据集的想法
您可以扩展这个逻辑工会多个数据集和做你任何聚集兴趣

#legacySQL 
SELECT table_id, 
    DATE(creation_time/1000) AS creation_date, 
    DATE(last_modified_time/1000) AS last_modified_date, 
    row_count, 
    size_bytes, 
    CASE 
     WHEN type = 1 THEN 'table' 
     WHEN type = 2 THEN 'view' 
     WHEN type = 3 THEN 'external' 
     ELSE '?' 
    END AS type, 
    TIMESTAMP(creation_time/1000) AS creation_time, 
    TIMESTAMP(last_modified_time/1000) AS last_modified_time, 
    dataset_id, 
    project_id 
FROM [project.dataset1.__TABLES__], 
    [project.dataset2.__TABLES__], 
    [project.dataset3.__TABLES__], 
    [project.dataset4.__TABLES__], 
    [project.dataset5.__TABLES__] 

Depends中在数据集的大小上(以它们中的表的数量而言)在查询之上的某个点处可以开始抱怨。所以你可能需要批量你的统计。希望这可以帮助

+0

这是结构化的方式,我有一个顶级项目名称,然后在下面我有一堆视图ID(8位数字)。在每个视图ID下面都有一堆ga_session表格。我继承了这个项目,并想知道哪些视图ID处于休眠状态,即每天停止添加新的ga_session表。我有兴趣修改上面的代码来替换通配符来代替'数据集'。这可以做到吗?我试过了 *。 –

+0

@MarkGinsburg - 不可以将通配符应用于数据集。但你可以做以上查询的联合来获得你想要的。看到调整的答案 –