我很感兴趣地听到,因为我工作,对数据仓库加载一个完全不同的看法当前网站创建和加载数据的其他开发人员的意见。MSSQL创建并加载数据
目前用于加载一个事实表中的协议具有若干步骤;
- 删除旧表
- 重新创建表,没有PK /聚簇索引
- 负荷清洗/新数据
- 创建PK &指标
我不知道有多少工作才真正进入在步骤4的封面下?数据在没有Clusterd索引的情况下加载,所以我假设数据加载的自然顺序定义了它在磁盘上的顺序。当第4步创建一个主键(聚簇)时,它将按照该顺序将磁盘上的数据重新排序。加载数据并且已经定义PK /聚簇索引从而减少服务器工作负载会不会更好?
只有当数据已经以与索引相同的顺序排序时。否则索引将不得不不断更新 –
@RichBenner这是不正确的。聚集索引会影响行的实际存储顺序。行被移动 –
@PanagiotisKanavos感谢您更新我,我删除了不正确的评论。 –