用Python构建环境
对于建设强化学习代理,将使用OpenAI Gym软件包,该软件包可使用以下命令来安装 -
pip install gym
OpenAI健身房有各种各样的环境可以用于各种目的。 其中很少是:Cartpole-v0,Hopper-v1和MsPacman-v0。 他们需要不同的引擎。
OpenAI Gym的详细文档可以在 https://gym.openai.com/docs/#environments 找到。
以下代码显示了cartpole-v0环境的Python代码示例 -
import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
env.render()
env.step(env.action_space.sample())
您可以用类似的方式构建其他环境。
用Python构建一个学习代理
对于构建强化学习代理,我们将使用如下所示的OpenAI Gym包 -
import gym
env = gym.make('CartPole-v0')
for _ in range(20):
observation = env.reset()
for i in range(100):
env.render()
print(observation)
action = env.action_space.sample()
observation, reward, done, info = env.step(action)
if done:
print("Episode finished after {} timesteps".format(i+1))
break
观察小推车可以平衡。
//更多请阅读:https://www.yiibai.com/ai_with_python/ai_with_python_reinforcement_learning.html
|