端到端的应用强化学习开放平台Horizon

Horizon是一个端到端的开源平台,可以在大规模生产环境中应用强化学习(RL)。

是facebook基于pytorch1.0,caffe2,spark为基础构建的。

用python实现的,可以用pytorch进行模型构建以及训练;可以用caffe2进行模型服务。

支持的算法:

•Discrete-Action(DQN)

•Parametric-Action DQN

•Double DQN, Dueling DQN, Dueling Double DQN

•DDPG (DDPG)

•Soft Actor-Critic (SAC)

安装:基于Anaconda来安装。

1.安装依赖包

cd Horizon/

conda install `cat requirements.txt`

2.安装ONNX

pip install onnx

3.设置java环境

export JAVA_HOME="$(dirname $(dirname -- `which conda`))"

4.安装spark

wget http://www-eu.apache.org/dist/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz

tar -xzf spark-2.3.1-bin-hadoop2.7.tgz

mv spark-2.3.1-bin-hadoop2.7 /usr/local/spark

5.安装openAI Gym

pip install "gym[classic_control,box2d,atari]"

6.安装horizon

pip install -e

使用;

运行测试

python setup.py test


分享到:


相關文章: