2017-10-11 128 views
1

我决定尝试使用Google Cloud Datalab处理我正在处理的小型项目,而不是AWS实例上Anaconda环境中的Jupyter Notebook。Datalab - 如何安装并保留包

如何在Datalab VM上安装软件包(例如OpenCV),以便每次重新启动VM时都不必重新安装软件包?为什么每次重新启动后程序包都会消失,但更新的笔记本电脑仍然保持不变?回答这些问题并阐明Datalab VM工作原理的任何帮助都会非常有帮助。

回答

2

笔记本电脑存储在码头卷装载中,该装载码表示永久性磁盘上的位置,该位置在重新启动VM时进行维护。

但是,您安装的软件包存储在正在运行的容器中,因此在每次重新启动时都会丢失。

您可以创建自定义泊坞窗图像并使用它。在datalab create命令中,请参阅--image-name参数。

这里是一个Dockerfile的例子,你需要使用:

FROM gcr.io/cloud-datalab/datalab:latest 
RUN pip install opencv 

请注意,你需要建立使用该码头工人文件泊坞窗图像,并将图像推到谷歌集装箱登记。我的记忆对此有些模糊,但可能需要将此图像标记为公开。

希望有帮助!

+1

谢谢,Nikhil!这就是说,我很努力地看到使用Datalab的好处,而不是在计算引擎虚拟机上安装Conda,并在那里运行Jupyter笔记本电脑。这样我就可以轻松地安装新软件包并让它们永久保持在实例上。我仍然不明白为什么我要在这种情况下使用Datalab?我阅读了文档,但这仍然不清楚。 – haroon7