在我的sparkconf中,我可以设置要使用的内核数量,我的笔记本电脑上有4个物理,8个逻辑,如果我指定的机器上不可能有数字,例如100个内核,火花会做些什么?如果我尝试使用比我更多的内核,会发生什么情况?
5
A
回答
7
核心数量不描述物理核心,而是描述正在运行的线程数量。这意味着如果该数字高于多个可用内核,则不会发生任何奇怪的事情。
根据您的设置,它可能实际上是一个首选配置,其值为通常推荐设置的可用内核数量的两倍左右。很显然,如果数量太高,应用程序将花费更多时间在线程之间切换而不是实际处理。
0
它很大程度上取决于您的群集管理器。我假设你在询问local[n]
运行模式。
如果是这样,那么驱动程序和唯一的一个执行程序与具有n
线程数的JVM相同。
DAGScheduler
- Spark执行计划程序将使用n
线程安排尽可能多的任务,如您所说的。
如果你有更多的任务,比如线程,那么你的操作系统将不得不处理比内核更多的线程并且适当地调度它们。
相关问题
- 1. 如果我使用printf(“one \ 0two”),会发生什么情况;?
- 2. 如果我的IExceptionPublisher引发异常,会发生什么情况?
- 3. 如果我更改我网站的域名,cookie会发生什么情况?
- 4. 如果我在.NET核心库中添加PackageReference net46,会发生什么情况?
- 5. TFS - 如果我删除工作区会发生什么情况?
- 6. 如果我不指定targetFramework =“4.0”,会发生什么情况?
- 7. 如果您尝试在单核心的计算机上使用TPL,会发生什么情况?
- 8. 如果我在未使用的pthread_t上调用pthread_join()会发生什么情况?
- 9. 如果您尝试释放已释放的对象,会发生什么情况?
- 10. 如果我更改HashSet中的对象,会发生什么情况?
- 11. 如果我尝试将drawImage()用于尚未完全加载的图像,会发生什么情况?
- 12. 如果我在GMP中不使用mpz_clear会发生什么情况?
- 13. C#如果我使用priority = RealTime运行进程,GC会发生什么情况?
- 14. 如果我在Play商店中更改类别,会发生什么情况?
- 15. 如果堆栈内存变满,会发生什么情况
- 16. 如果不使用Xmx会发生什么情况?
- 17. 如果Web服务更改参数会发生什么情况?
- 18. 如果我尝试拆分无法在python中拆分的字符串,会发生什么情况?
- 19. 如果我为不存在的参数调用ParamByName,会发生什么情况?
- 20. 如果我将整数发送到BigQuery字段“string”,会发生什么情况?
- 21. 如果在rootfs上发生内存泄漏,会发生什么情况?
- 22. 如果我违反了对ProgIDs的要求,会发生什么情况?
- 23. 如果我们遵循HTML中的错误语法,会发生什么情况
- 24. minimax:如果min不起作用会发生什么情况
- 25. 如果CFile :: Write引发异常会发生什么情况?
- 26. 如果finally块引发异常,会发生什么情况?
- 27. 如果我在不同布局的多个小部件中使用相同的id,会发生什么情况?
- 28. 为什么会发生这种情况与我的变量?
- 29. 如果我在asp.net中创建线程,会发生什么情况?
- 30. 如果我从stardog连接池关闭连接,会发生什么情况
在本地模式下运行spark的实验中,我看到了设置'master =“local [4 * physical cores]'''的好结果。它将我的CPU利用率从40%左右提高到80%左右。绝对值得尝试配置Spark使用比可用物理内核多2,4或8倍的线程。 – asmaier