Text Generation - Groups

BookCorpus

The dataset used in this paper for unsupervised sentence representation learning, consisting of paragraphs from unlabeled text.
- Dataset
- JSON
WikiText-103 dataset

The dataset used in this paper is the WikiText-103 dataset, which contains a large corpus of text.
- Dataset
- JSON
Training Transformers to Perform Tasks

A dataset for training transformers to perform tasks such as language translation and text generation.
- Dataset
- JSON

43 datasets found