Dataset Preparation

August 19, 2025 ยท View on GitHub

DataSize
osprey_short_form.json57 MB
osprey_conversation.json106 MB
osprey_detail_description.json63.4 MB
osprey_part_level.json153 MB
osprey_lvis_positive_negative.json140 MB

After downloading all of them, organize the data as follows in ./data,

โ”œโ”€โ”€ coco
โ”‚   โ”œโ”€โ”€ annotations
โ”‚   โ”‚   โ””โ”€โ”€ instances_train2017.json
โ”‚   โ””โ”€โ”€ imgs
โ”œโ”€โ”€ part data
โ”‚   โ”œโ”€โ”€ pascal_part
โ”‚   โ”‚   โ”œโ”€โ”€ train.json
โ”‚   โ”‚   โ””โ”€โ”€ VOCdevkit
โ”‚   โ””โ”€โ”€ partImagenet
โ”‚       โ”œโ”€โ”€ train_format.json
โ”‚       โ””โ”€โ”€ train
โ”œโ”€โ”€ refcocos
โ”‚   โ”œโ”€โ”€ finetune_refcoco_train_with_mask.json
โ”‚   โ””โ”€โ”€ finetune_refcoco+_train_with_mask.json
โ”œโ”€โ”€ Osprey-724K
โ”‚   โ”œโ”€โ”€ osprey_short_form.json
โ”‚   โ”œโ”€โ”€ osprey_conversation.json
โ”‚   โ”œโ”€โ”€ osprey_detail_description.json
โ”‚   โ”œโ”€โ”€ osprey_part_level.json
โ”‚   โ””โ”€โ”€ osprey_lvis_positive_negative.json
โ”œโ”€โ”€ vg
โ”‚   โ”œโ”€โ”€ vg_train_with_mask.json
โ”‚   โ””โ”€โ”€ image
โ””โ”€โ”€ vcr
    โ”œโ”€โ”€ train.jsonl
    โ””โ”€โ”€ vcr1images