Universal and transferable adversarial attacks on aligned language models - Original Metadata

Cite this as

Andy Zou, Zifan Wang, J. Zico Kolter, Matt Fredrikson (2024). Dataset: Universal and transferable adversarial attacks on aligned language models. Resource: Original Metadata. https://doi.org/10.57702/2oo2r02d

DOI retrieved: December 3, 2024

Additional Information

Field	Value
Created	December 3, 2024
Last updated	December 3, 2024
Format	JSON

Before browse our site, please accept our cookies policy

Original Metadata

Cite this as

Additional Information

Embed resource view