Human Preference - Groups - LDM

HH-RLHF

The HH-RLHF dataset is a human preference dataset for reinforcement learning from human feedback.
- Dataset
- JSON

Before browse our site, please accept our cookies policy