data-warehouse

    1热度

    1回答

    我有一个配置单元内部表,它有大约5亿条记录。 我的配置单元部署在AWS EMR之上。我不想让AWS EMR始终运行。因此我想要备份配置单元内部表数据。 一个简单的方法可以创建一个指向S3位置的外部表,然后使用insert命令将所有记录移动到该外部表中。 当我需要内部表回来时,我可以使用这个外部S3表获取所有数据。 由于此表仅用于备份,我想问问哪种存储格式对我来说是最佳选择。 蜂巢截至目前支持以下格

    0热度

    1回答

    我正在研究DW。我尝试在AdventureWorkDW2012上练习。 但我有这个问题。 我创建了两个立方体: 1)互联网营销魔方:从FactInternetSales度& DimDate在DimDate层次结构(会计季度 - >会计年度 - >日期键) 2)金融魔方:从FactFinance DimDate与DimDate中的层次结构(实例为DimDate1)与Internet Sale多维数据

    1热度

    1回答

    作为日历维度的一部分,我需要填充iso_week_start_date,iso_week_end_date和iso_week_number。除了这些字段,我已经能够构建日历维度。谢谢。

    0热度

    1回答

    我在过去几天一直在研究数据仓库,特别是我一直在阅读Data Wharehouse工具包 - 由Kimball和Ross编写的维度建模权威指南。 Uppon,阅读,我来到了第一个exapmle那里是一个销售事实,它与商品相关的尺寸,你可以在波纹管图片中看到: 我想我可以掌握这种关系如何让我们旋转“立方体”切片和切块数据的要点,但是这是我迷失的地方: 在这个例子中,许多其他网络产品是一对一的关系与销售

    0热度

    1回答

    我有这样的数据 MAPPING表1: ID1 NAME1 ----------- 001 1 002 2 DATA表: TID_1 TNAME_1 ------------------ 1 ABCNAME 2 DEFNAME 另一个MAPPING表2: ID2 NAME2 -------------- 001 1 002 2 DATA表: TC_ID2 TC_

    0热度

    1回答

    我有一个DimDate表具有一个Billable Day Portion字段,可以介于0和1之间。对于当前Bonus Period中的每一天,我想多个日期部分减去10,然后返回总和。 要找出Bonus Period我们在,我回到ContinuousBonusPeriod其中的日期今天等于: Current Continuous Bonus Period:= CALCULATE(MAX(DimDat

    0热度

    1回答

    我想从Oracle转换到红移,并陷入了这种函数转换。有人可以帮我这个?: 甲骨文: RESOLVED_DATE BETWEEN DATE_TRUNC(TO_DATE('{RUN_DATE_YYYYMMDD}','YYYYMMDD'),'Y') AND TO_DATE('{RUN_DATE_YYYYMMDD}','YYYYMMDD') 红移:? 我想从一年的开始日期到查询运行日期。

    1热度

    1回答

    看起来Azure SQL数据仓库不支持OFFSET语句(作为ORDER BY的一部分)。我很好奇从Azure-DW中获取分页数据的最佳方式是什么?

    -1热度

    3回答

    我想对MYSQL数据库的数据表执行ETL操作并将数据存储在azure数据仓库中。我没有更新日期列以标识期间的修改记录。我如何才能知道哪条记录被修改。 MYSQL数据库是否支持CDC? 使用Azure服务(Azure数据工厂)可以读取MYSQL二进制日志或二进制日志?

    0热度

    1回答

    我有一个按年(char),月(char)和其他3个维度组织的摘要物化视图,后面跟着许多度量。我的数据从2013年到现在的时间和连续增量。由于潜在的事实表是巨大的(500 + M行每年增加100 + M),我正在考虑对表和MV进行分区,以便刷新MV中的最后12个月。 经过多次阅读后,我应该按范围(每个月)对事实表进行分区,按月划分MV,按年划分子划分。 我知道分区策略对于性能至关重要,所以我问是否有