Arabic Language - Groups

Qiyas Benchmark

The Qiyas benchmark is a standardized General Aptitude Test (GAT) used for university admissions in Saudi Arabia, ensuring its quality and relevance to real-world assessment. It...

Dataset
JSON

ARAGPT2

ARAGPT2 is a stacked transformer-decoder model trained using the causal language modeling objective. The model is trained on 77GB of Arabic text.

Dataset
JSON

Validation Dataset

The Validation Dataset is used for validation, it contains 1428 images from nine distinct rooms.

Dataset
JSON

Training Dataset

The training dataset is a collection of the publicly available Arabic corpora listed below: The unshufﬂed OSCAR corpus (Ortiz Su´arez et al., 2020). The Arabic Wikipedia dump...

Dataset
JSON

4 datasets found

Qiyas Benchmark

ARAGPT2

Validation Dataset

Training Dataset