1
从任务(地图功能)中创建的火花任务是否有可能做从映射功能pyspark地图(从任务即)? 换句话说,是否可以从任务中打开“子任务”? 如果是这样 - 我如何将sparkContext传递给任务 - 就像变量一样?在同一个应用程序
我想有一个由许多任务组成的工作 - 这些任务应该创造许多任务为好,不回去给驾驶员。
我的用例如下: 我正在做一个使用工作队列编写的应用程序的代码移植 - pyspark。 在我的旧应用程序任务中创建了其他任务 - 并且我们使用了这个功能。我不想重新设计整个代码,因为这个举动会引发火花(尤其是因为我将不得不确保两个平台都能在系统之间的瞬态阶段工作)...
感谢您的帮助 - 我认为这将是答案。 我玩了一下,我实际上成功地创建了其他应用程序(火花上下文)从任务和事情似乎在小规模集群上正常工作。 我很害怕,这是一个黑客和行为将是不确定的...... 你解决了我的两难困境。 –
@OferE。你的意思是*新的*火花上下文,对吧? – gsamaras
是 - 和它的工作 - 我不得不在资源配置中的一些问题,因为主要驱动力把所有的CPU和子任务的司机得到了饿死 - 但它可以使用特殊和复杂的配置来解决.... 我很害怕,这是太hacky,并且行为是未定义的。 我也想避免丑陋的配置必要 - 这就是为什么我问同一个应用程序的子任务(我的想法是使用公平调度,以避免饥饿)。 –