0
场景:您正在编写一个MR作业,它将使用映射器来处理数据,然后使用Reducers将结果数据直接插入到外部RDBMS中。您一定要做什么?以及为什么我们如何使用Reducers将结果数据直接插入到外部RDBMS中。您一定要做什么?以及为什么
需要前提: 1.确保提交作业的客户机上存在数据库驱动程序。 2.数据插入作业的禁止性推测执行
场景:您正在编写一个MR作业,它将使用映射器来处理数据,然后使用Reducers将结果数据直接插入到外部RDBMS中。您一定要做什么?以及为什么我们如何使用Reducers将结果数据直接插入到外部RDBMS中。您一定要做什么?以及为什么
需要前提: 1.确保提交作业的客户机上存在数据库驱动程序。 2.数据插入作业的禁止性推测执行
1)如果您忘记禁用推测性执行,可能会运行给定Reducer的多个实例,这会导致RDBMS中的额外数据超出预期。 2)即使我们需要客户端机器的数据库驱动程序,如果您打算从该客户端连接到RDBMS,则不需要它。
所以“1”选项是正确的。
我得到了这个解决方案,可以任何身体改善这个答案或让我更正如果有任何问题。谢谢