Training a helpful and harmless assistant with reinforcement learning from human feedback - Original Metadata

Cite this as

Yuntao Bai, Andy Jones, Kamal Ndousse, Amanda Askell, Anna Chen, Nova DasSarma, Dawn Drain, Stanislav Fort, Deep Ganguli, Tom Henighan (2024). Dataset: Training a helpful and harmless assistant with reinforcement learning from human feedback. Resource: Original Metadata. https://doi.org/10.57702/ueb4xymx

DOI retrieved: December 2, 2024

Additional Information

Field	Value
Created	December 2, 2024
Last updated	December 2, 2024
Format	JSON

Before browse our site, please accept our cookies policy

Original Metadata

Embed resource view

Cite this as

Additional Information