GPT-2 XL

doi:doi:10.57702/borltms7

GPT-2 XL

The GPT-2 dataset is a large language model, specifically the GPT-2 XL model, trained on the Common Crawl dataset.

BibTex:

@dataset{Steven_Bill_and_Alec_Radford_and_Iishita_Gupta_and_Jason_Weston_and_Stephen_Roller_and_Jamie_Ray_and_Mike_Thorne_and_Yiming_Yang_and_Zhilin_Yang_and_Wen-tau_Hsieh_and_Kaito_Kawaguchi_and_Keunwoo_Kim_and_Jasa_Gupta_and_Anirudh_Anantharaman_and_Amanpreet_Singh_and_Edwin_Chen_and_Suriya_Sikdar_and_Omar_Bilello_and_Yiming_Yang_and_Zhilin_Yang_2024,
    abstract = {The GPT-2 dataset is a large language model, specifically the GPT-2 XL model, trained on the Common Crawl dataset.},
    author = {Steven Bill and Alec Radford and Iishita Gupta and Jason Weston and Stephen Roller and Jamie Ray and Mike Thorne and Yiming Yang and Zhilin Yang and Wen-tau Hsieh and Kaito Kawaguchi and Keunwoo Kim and Jasa Gupta and Anirudh Anantharaman and Amanpreet Singh and Edwin Chen and Suriya Sikdar and Omar Bilello and Yiming Yang and Zhilin Yang},
    doi = {10.57702/borltms7},
    institution = {No Organization},
    keyword = {'GPT-2', 'GPT-2 XL', 'Natural Language Processing'},
    month = {dec},
    publisher = {TIB},
    title = {GPT-2 XL},
    url = {https://service.tib.eu/ldmservice/dataset/gpt-2-xl},
    year = {2024}
}