Memory
SingleUseBuffer
- class srl.rl.memories.single_use_buffer.SingleUseBuffer
ReplayBuffer
- class srl.rl.memories.replay_buffer.ReplayBufferConfig(capacity: int = 100000, warmup_size: int = 1000, compress: bool = True, compress_level: int = -1)
- capacity: int = 100000
capacity
- warmup_size: int = 1000
warmup_size
- compress: bool = True
memoryデータを圧縮してやり取りするかどうか
- compress_level: int = -1
memory(zlib)の圧縮レベル
PriorityReplayBuffer
- class srl.rl.memories.priority_replay_buffer.PriorityReplayBufferConfig(capacity: int = 100000, warmup_size: int = 1000, compress: bool = True, compress_level: int = -1, enable_demo_memory: bool = False, select_memory: Literal['main', 'demo'] = 'main', demo_ratio: float = 0.00390625)
- capacity: int = 100000
capacity
- warmup_size: int = 1000
warmup_size
- compress: bool = True
memoryデータを圧縮してやり取りするかどうか
- compress_level: int = -1
memory(zlib)の圧縮レベル
- enable_demo_memory: bool = False
demo memoryを使うかどうか
- select_memory: Literal['main', 'demo'] = 'main'
経験収集を行うメモリの種類
- demo_ratio: float = 0.00390625
demo memoryの混ぜる割合
- class srl.rl.memories.priority_memories.replay_buffer.ReplayBuffer(capacity: int)
- class srl.rl.memories.priority_memories.proportional_memory.ProportionalMemory(capacity: int, alpha: float = 0.6, beta_initial: float = 0.4, beta_steps: int = 1000000, has_duplicate: bool = True, epsilon: float = 0.0001)
- alpha: float = 0.6
priorityの反映度、0の場合は完全ランダム、1に近づくほどpriorityによるランダム度になります。
- beta_initial: float = 0.4
βはISを反映させる割合。ただβは少しずつ増やし、最後に1(完全反映)にします。そのβの初期値です。
- beta_steps: int = 1000000
βを何stepで1にするか
- has_duplicate: bool = True
sample時に重複をきょかするか
- epsilon: float = 0.0001
priorityを0にしないための小さい値
- class srl.rl.memories.priority_memories.rankbased_memory.RankBasedMemory(capacity: int = 100000, alpha: float = 0.6, beta_initial: float = 0.4, beta_steps: int = 1000000)
- alpha: float = 0.6
priorityの反映度、0の場合は完全ランダム、1に近づくほどpriorityによるランダム度になります。
- beta_initial: float = 0.4
βはISを反映させる割合。ただβは少しずつ増やし、最後に1(完全反映)にします。そのβの初期値です。
- beta_steps: int = 1000000
βを何stepで1にするか
- class srl.rl.memories.priority_memories.rankbased_memory_linear.RankBasedMemoryLinear(capacity: int = 100000, alpha: float = 1.0, beta_initial: float = 0.4, beta_steps: int = 1000000)