Horizon是一个端到端的开源平台,可以在大规模生产环境中应用强化学习(RL)。
是facebook基于pytorch1.0,caffe2,spark为基础构建的。
用python实现的,可以用pytorch进行模型构建以及训练;可以用caffe2进行模型服务。
支持的算法:
•Discrete-Action(DQN)
•Parametric-Action DQN
•Double DQN, Dueling DQN, Dueling Double DQN
•DDPG (DDPG)
•Soft Actor-Critic (SAC)
安装:基于Anaconda来安装。
1.安装依赖包
cd Horizon/
conda install `cat requirements.txt`
2.安装ONNX
pip install onnx
3.设置java环境
export JAVA_HOME="$(dirname $(dirname -- `which conda`))"
4.安装spark
wget http://www-eu.apache.org/dist/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz
tar -xzf spark-2.3.1-bin-hadoop2.7.tgz
mv spark-2.3.1-bin-hadoop2.7 /usr/local/spark
5.安装openAI Gym
pip install "gym[classic_control,box2d,atari]"
6.安装horizon
pip install -e
使用;
运行测试
python setup.py test
閱讀更多 AI踐行者 的文章