1
我想使用定制AMI(码头?)为执行深度学习培训任务推出多个Amazon EC2现货实例(车队?)。为了训练模型,我希望所有实例都共享一组通用文件。使用AMI和公用文件的亚马逊EC2现货实例车队
当由于价格限制/需求导致现货实例被AWS终止时,这里的想法并不是失去培训历史并在EBS(网络驱动器?)中保留备份。任务状态可以在文件中更新,然后在实例可用时恢复。
是否可以启动所有实例并让它们协同工作来完成培训任务?什么样的设置可以实现这一点?
感谢您指出DL AMI。您的意见非常感谢。正如我所看到的,现场实例车队是AWS中非常有价值和成本效益的工具。我将在这个主题上进行实验并发表我的学习内容。我也在研究他们的API来自动执行一些任务。 –
嗨@SampathVanimisetti,如果这个或任何答案已经解决了您的问题,请点击复选标记考虑[接受它](http://meta.stackexchange.com/q/5234/179419)。这向更广泛的社区表明,您已经找到了解决方案,并为答复者和您自己提供了一些声誉。没有义务这样做。 –
道歉!你可能已经注意到了,在这里新的东西。我尝试了upvoting,但似乎我需要声誉点才能够这样做。我已经接受了答案。 –