我有一个DataSet.map
操作,需要从外部REST API中提取数据。如何从map/filter/etc执行异步操作(即返回Future)?
REST API客户端返回Future[Int]
。
是否有可能让DataSet.map
操作以某种方式异步等待Future
?或者我是否需要使用Await.result
来阻止线程?或者,这只是不完成的事情......也就是说,我应该尝试将API保存的数据加载到它自己的DataSet
中,然后执行join
?
在此先感谢!
编辑:
不同的:Spark job with Async HTTP call
原因:这个问题是公开讨论如何以不同的方式解决这个问题,比如说,使用第二DataSet
和join
代替。此外,关于Spark是否可以处理异步转换 - 以及它是否可以 - 如何构造它们,链接问题没有包含明确的答案。
以防万一,如果有任何人寻找异步http调用spark工作.. [结帐 这(])(https://stackoverflow.com/a/45946369/150371) – raksja