点击上方关注,All in AI中国
Kaggle、TensorFlow、PyTorch、MxNet等等只需这几步!
无论您是第一次设置TensorFlow的新手数据科学爱好者,还是使用TB级数据的经验丰富的AI工程师,在安装库、软件包和框架的时候总会这样或那样的问题。
虽然像Docker这样的集装箱化工具真正彻底改变了软件的可重复性,但它们还没有在数据科学和人工智能社区中流行起来。随着不断发展的机器学习框架和算法,很难花时间专注于去学习另一个开发人员工具,尤其是那些与模型构建过程没有直接关联的工具。
在这篇博文中,我将向您展示如何使用一个名为datmo的简单python包为任何流行的数据科学和AI框架设置环境,只需几个简单的步骤。 Datmo充分利用了Docker,简化了流程,帮助您快速轻松地运行。
0.先决条件
- 安装并启动Docker
- (如果使用GPU)安装CUDA 9.0
1.安装datmo
就像任何python包一样,我们可以使用以下命令从终端安装datmo:
2.初始化datmo项目
在终端中,cd到要开始构建模型的文件夹。然后,输入以下命令:
然后,您将被要求提供项目的名称和描述——你可以随意命名。
3.启动环境设置
在输入名称和描述后,datmo将询问您是否要设置环境——打出y并按下Enter键。
4.选择系统驱动程序(CPU或GPU)
然后,CLI将询问您希望为您的环境选择哪些系统驱动程序?如果您不打算使用GPU,可以选择CPU。
5.选择一个环境
接下来,您将从众多预打包环境中选择一种。只需在提示中回复您要使用的环境的编号或ID。
6.选择语言版本(如果适用)
上述许多环境都有不同的版本,具体取决于您计划使用的语言和版本。
例如,在选择了keras-tensorflow环境之后,我将面临以下提示,询问我是否要使用Python 2.7或Python 3.5。
7.启动工作区
您已经正确选择了您的环境,现在是时候启动您的工作区了。选择您要使用的工作区,然后在终端中输入相应的命令。
Jupyter笔记本 - $ datmo notebook
JupyterLab - $ datmo jupyterlab
RStudio - $ datmo rstudio(在R-base环境中可用)
终端 - $ datmo terminal
设置好了!第一次为新环境初始化工作空间时,需要花费一些时间来获取所有资源,但在连续运行中它明显更快。
一旦您的工作区启动,您就可以开始导入包含在您选择的环境中的包和框架里了!例如,如果用户选择了keras-tensorflow环境,那么导入tensorflow将在Jupyter Notebook中开箱即用!
如果您正在使用TensorFlow,则可以从datmo文档中尝试此示例来运行您的第一个TensorFlow图。
閱讀更多 AI中國 的文章