OpenAI_gym的官网案例 - 企库往资讯移动站

OpenAI_gym的官网案例

2024-12-18 02:36

创建，渲染，随机选择动作
当然这只是gym的一个游戏，还有一些如： MountainCar-v0, MsPacman-v0 (requires the Atari dependency), or Hopper-v1 (requires the MuJoCo dependencies). Environments all descend from the Env base class.

import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
env.render()
env.step(env.action_space.sample()) # take a random action

环境重置，返回动作，奖励，状态，是否终止
往环境输入一个动作后返回，环境执行完该动作后的一些信息env.step(action)

import gym
env = gym.make('CartPole-v0')
for i_episode in range(20):
observation = env.reset()
for t in range(100):
env.render()
print(observation)
action = env.action_space.sample()
observation, reward, done, info = env.step(action)
if done:
print("Episode finished after {} timesteps".format(t+1))
break

动作空间和状态空间
打印动作空间和状态空间：

OpenAI_gym的官网案例

Discrete(2)表示该环境的动作空间为离散的动作空间（0,1）
Box(4,)表示该状态空间是一个一维向量构成
import gym
env = gym.make('CartPole-v0')
print(env.action_space)
#> Discrete(2)
print(env.observation_space)
#> Box(4,)

同时可以获取状态空间的每一维度的最值

print(env.observation_space.high)
#> array([ 2.4 , inf, 0.20943951, inf])
print(env.observation_space.low)
#> array([-2.4 , -inf, -0.20943951, -inf])

gym提供了自定义的空间

from gym import spaces
space = spaces.Discrete(8) # Set with 8 elements {0, 1, 2, ..., 7}
x = space.sample()
assert space.contains(x)
assert space.n == 8

gym自带所有的环境
返回所有环境

以上就是本篇文章【OpenAI_gym的官网案例】的全部内容了，欢迎阅览！文章地址：https://sicmodule.kub2b.com/quote/7461.html
栏目首页相关文章动态同类文章热门文章网站地图返回首页企库往资讯移动站https://sicmodule.kub2b.com/mobile/,查看更多