Referencing - Groups

RefCOCO+ and RefCOCOg

The RefCOCO+ and RefCOCOg datasets are benchmarks for referring expression comprehension. They contain images of objects and natural language descriptions of the objects.

Dataset
JSON

URVOS: Uniﬁed referring video object segmentation network with a large-scale ...

URVOS: Uniﬁed referring video object segmentation network with a large-scale benchmark.

Dataset
JSON

RefVOS: a closer look at referring expressions for video object segmentation

RefVOS: a closer look at referring expressions for video object segmentation.

Dataset
JSON

ScanRefer

ScanRefer is a dataset of 51,583 referring descriptions of 11,046 objects from 800 ScanNet scenes.

Dataset
JSON

RefCOCOg

The RefCOCOg dataset is a reconstructed dataset of the MS-COCO dataset, containing 85,474 referring expressions for 54,822 objects in 26,711 images.

Dataset
JSON

RefCOCO

The dataset used in the paper is a benchmark for referring expression grounding, containing 142,210 referring expressions for 50,000 referents in 19,994 images.

Dataset
JSON