2018-05-30 21:34:15 AI中國

在云中训练ML模型很有意义。为什么?

有许多原因，首先它支持你在大规模数据计算的同时还可以训练模型。另外，在GoogleCloud平台上，你可以使用Cloud Machine Learning Engine在TensorFlow和其他PythonML库(如Scikit-Learning)中训练机器学习模型，而无需操心任何基础设置。当然，前提是你将代码放入了Python包。

task.py文件

作为一名资深人士，作者表示许多新手面临的第一个困难就是创建task.py文件。虽然你可以不使用task.py文件(参见下面)，但作者认为使用它还是有必要的。因为它允许你将超参数从模型逻辑中分离出来(位于model.py)。task.py文件的用途有两个：

1，读取和解析模型参数，如训练数据和输出模型的位置、隐藏层、大小等。

2，调用model.py

编写task.py 有许多种方法- -你甚至可以给它取新名字。事实上task.py和model.py也仅仅是一种约定俗成的叫法。只要你愿意，我们也可以叫它们为task.py aReallyCoolArgument_parser.py 和model.py very_deeeep_model.py。

我们甚至可以将它俩组合成一个文件，用于参数解析和模型训练。除了将代码放到Python包外，ML对其他并没有什么要求。(也就是说，它必须包含setup.py和__init__.py，对其他则没有什么要求)。但是，要把task.py和model.py在一个文件夹中训练，你需要查看Cloud ML样本和Cloud ML训练反馈记录，了解使用Cloud ML引擎的完整示例和关于task.py、model.py的实例。

通过docopt编写“干净的” task.py文件

虽然很多人喜欢使用Argparse编写task.py（Argparse，一个用于解析命令行参数的标准Python库），但作者更喜欢用docopt。因为作者认为这是编写task.py最简洁的方式。他表示如果使用docopt，你编写的唯一东西就是程序的用法信息（即帮助信息），其他的docopt会帮你处理好。它会根据你在模块的文档字符串中编写的用法消息，和你在文档字符串中指定的格式为你生成参数解析器。这里是具体实例。