Dataset - LDM

Policy Optimization for Low-rank MDPs (POLO)

Learning Adversarial Low-rank Markov Decision Processes with Unknown Transition and Full-information Feedback
- Dataset
- JSON
State-wise Constrained Policy Optimization

State-wise Constrained Policy Optimization (SCPO) is a general-purpose policy search algorithm for state-wise constrained reinforcement learning.
- Dataset
- JSON
Policy Optimization for Stochastic Shortest Path

Policy optimization for stochastic shortest path (SSP) problem, a goal-oriented reinforcement learning model that strictly generalizes the finite-horizon model and better...
- Dataset
- JSON

You can also access this registry using the API (see API Docs).

3 datasets found