Image Captioning Datasets

Arabic

Arabic Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

English

English Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Finnish

Finnish Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

French

French Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

German

German Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Gujarati

Gujarati Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Hindi

Hindi Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Malayalam

Malayalam Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Norwegian

Norwegian Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Portuguese

Portuguese Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Spanish

Spanish Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Swedish

Swedish Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Filipino

Filipino Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Ukrainian

Ukrainian Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Bahasa

Bahasa Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Bengali

Bengali Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Danish

Danish Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Dutch

Dutch Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Italian

Italian Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Japanese

Japanese Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Kannada

Kannada Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Korean

Korean Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Chinese

Chinese Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Marathi

Marathi Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Odia

Odia Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Polish

Polish Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Punjabi

Punjabi Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Russian

Russian Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Tamil

Tamil Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Telugu

Telugu Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Turkish

Turkish Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Urdu

Urdu Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Bulgarian

Bulgarian Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Czech

Czech Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Romanian

Romanian Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Thai

Thai Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Malay

Malay Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Vietnamese

Vietnamese Image Captioning Dataset

A collection of diverse images paired with corresponding captions.

5,000+ Images

25000+ Captions

Image Caption ModelsMulti Modal Learning

Explore Our Latest Insightful Blog

Visual Image Captioning Datastes

Language