2010-12-16 91 views
13

从文章跳转到文章,我可以在任何地方看到表达“批量加载”。“散货”是什么意思?

它真的(技术上)是什么意思?

这是什么意思?

基于用例的解释是受欢迎的。

回答

18

索引通常针对一次插入一行来进行优化。当您一次添加大量数据时,一次插入一行可能效率不高。例如,使用B-Tree时,插入单个键的最佳方法是向一个空索引添加一堆数据的方法很差。

而是你追求与B-Trees不同的策略。您预设所有数据,并将其分组。然后,您可以通过将块转换为树节点来构建新的B-Tree。虽然两种技术具有相同的渐近性能,O(n log(n)),但批量加载操作的因子要小得多。

6

批量加载是一种在“大块”中加载数据(通常放入数据库)的方法。如果您可能会在系统中一次输入客户或采购订单或库存中的物料信息,则批量加载将获取相同类型信息的文件,并在短时间内加载数百/千/百万条记录。

如果您从一种DBMS转换为另一种DBMS,则希望不要将所有信息从旧数据库输入到新数据库中。相反,您可以将旧数据库中的信息以新DB容易读取的格式转储到文件中,然后将该数据导入到新数据库中。

这就是散装限嗣继承(在35K水平尺,反正)

2

批量加载用于导入/导出大量数据。通常批量操作不会被记录,事务完整性可能无法按预期工作。通常批量操作会绕过触发器和完整性检查(如约束)。这大大提高了大量数据的性能。

1

需要记住的一件事是批量加载意味着从源到目标的数据内容是相同的,但只有源系统默认时才是如此。对于任何数据源,尤其是大数据的情况,源数据在读取数据并进行数据传输后可能会发生变化。传统的在线系统要么需要离线更新,要么暂停更新,如果捕获的时间点与源需要匹配的话。