GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks

doi:doi:10.57702/tnasnlb9

GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks

Automatically evaluating vision-language tasks is challenging, especially when it comes to reflecting human judgments due to limitations in accounting for fine-grained details.

Data and Resources

Original MetadataJSON
The json representation of the dataset with its distributions based on DCAT.
Explore
- Preview
- Download

Cite this as

Xinlu Zhang, Yujie Lu, Weizhi Wang, An Yan, Jun Yan, Lianke Qin, Heng Wang, Xifeng Yan, William Yang Wang, Linda Ruth Petzold (2025). Dataset: GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks. https://doi.org/10.57702/tnasnlb9

DOI retrieved: January 2, 2025

Additional Info

Field	Value
Created	January 2, 2025
Last update	January 2, 2025
Defined In	https://doi.org/10.48550/arXiv.2311.01361
Author	Xinlu Zhang
More Authors	Yujie Lu Weizhi Wang An Yan Jun Yan Lianke Qin Heng Wang Xifeng Yan William Yang Wang Linda Ruth Petzold