我已经在java中编写了一个用于处理大量数据的代码。我想将它分发到多台机器上以处理部分数据并更快地完成处理。我之前从未从事过分布式计算。有没有工具可以完成这项工作?谢谢。如何在多台机器上通过java分发程序?
回答
Gridgain工作得很好。 Hadoop是一个伟大的,但需要更多的开发。 Hazelcast coulb是一个很好的局外人
我也可以引用其他人,但是如果不知道涉及的数据类型和处理类型,很难回答你的问题。进程I/O密集型还是CPU绑定?
其中一个问题是“数据集有多大?”。
谢谢。我刚刚阅读了Hadoop,试图找到如何指导。我需要找到每对数据集之间的交集。因此,即使是相对较大的数据也需要很长时间。 – 2012-07-25 09:04:44
处理是CPU绑定的。 – 2012-07-25 09:32:25
自3年以来,我们在生产中使用Gridgain,并且我们发现它非常灵活且易于使用。这是CPU密集型任务 – Grooveek 2012-07-25 09:43:07
好像你想要做一个map-reduce algorithem。
Hadoop是一个开源项目,提供了一个框架来做到这一点。
- 1. 远程ssh通过多台机器
- 2. 运行在同一台机器上的多个Java程序
- 3. 如何在多台机器上群集节点应用程序
- 4. 在多台机器上分配状态
- 5. 通过另一台分机在铬上发送请求
- 6. 通过互联网在多台机器上使用D-Bus
- 7. 如何通过PowerShell脚本本身在多台机器上安装PowerShell模块
- 8. 如何在多个服务器上分发j2ee应用程序?
- 9. 程序员如何在多台计算机上工作?
- 10. 如何在多台远程机器上运行Jython脚本?
- 11. 如何在多台远程机器上设置多主机网络与docker swarm
- 12. 分发Java控制台程序
- 13. 如何在另一台机器上运行web应用程序?
- 14. 如何在同一台机器上的程序之间进行通信?
- 15. 如何通过Java控制台应用程序进行分页执行“less”?
- 16. 位于一台机器上或两台机器上的两个进程的Java nio套接字通信
- 17. 在多台机器上的进程之间的锁机制
- 18. 如何将私人程序分发给100多台设备?
- 19. 如何在多个字段上创建远程过滤器?分机Js 5
- 20. MongoDB在一台机器上分片
- 21. 如何在远程机器上使用java机器人类
- 22. Java:多平台程序的可过滤文件浏览器?
- 23. GDB服务器 - 如何附加多台机器上的多个进程?
- 24. 如何通过同一台机器上的TCP套接字在java中进行通信
- 25. 进程间通信:一台服务器和多台客户机
- 26. PHP:gzdeflate在多台机器上安全吗?
- 27. 多台Informatica Powercenter客户机在同一台机器上?
- 28. 如何让桌面应用程序调用同一台机器上的Java应用程序上的方法
- 29. 如何通过java连接远程windows机器?
- 30. 通过Java应用程序发布URL
听起来像你正在寻找一个[hadoop](http://hadoop.apache.org/)集群 – Joost 2012-07-25 08:43:43
我会确保你正在尽可能有效地处理数据,并且IO不是瓶颈。多台机器提供更多的CPU和内存,但可能会使IO瓶颈变得更糟。 – 2012-07-25 09:25:07
@PeterLawrey我相信IO在我的情况下不是问题。这是需要很多时间的处理。这就是为什么我想分发它。谢谢 – 2012-07-25 09:33:49