Multilingual Parallel Corpora Datasets

Arabic Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Arabic language.

Assamese Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Assamese language.

Bahasa Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Bahasa language.

Bengali Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Bengali language.

Bulgarian Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Bulgarian language.

Chinese Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Chinese language.

Czech Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Czech language.

Danish Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Danish language.

Dutch Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Dutch language.

English Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in English language.

Finnish Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Finnish language.

French Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in French language.

German Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in German language.

Gujarati Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Gujarati language.

Hindi Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Hindi language.

Italian Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Italian language.

Japanese Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Japanese language.

Kannada Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Kannada language.

Korean Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Korean language.

Malay Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Malay language.

Malayalam Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Malayalam language.

Mandarin Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Mandarin language.

Marathi Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Marathi language.

Norwegian Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Norwegian language.

Odia Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Odia language.

Polish Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Polish language.

Portuguese Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Portuguese language.

Punjabi Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Punjabi language.

Romanian Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Romanian language.

Russian Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Russian language.

Spanish Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Spanish language.

Swedish Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Swedish language.

Filipino Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Filipino language.

Tamil Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Tamil language.

Telugu Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Telugu language.

Thai Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Thai language.

Turkish Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Turkish language.

Ukrainian Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Ukrainian language.

Urdu Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Urdu language.

Vietnamese Parallel Datasets

15+ Datasets

Explore ready-to-deploy Text datasets in Vietnamese language.

Explore Our Latest Insightful Blog

Parallel Corpora Datasets for Machine Translation

Language

Arabic Parallel Datasets

Assamese Parallel Datasets

Bahasa Parallel Datasets

Bengali Parallel Datasets

Bulgarian Parallel Datasets

Chinese Parallel Datasets

Czech Parallel Datasets

Danish Parallel Datasets

Dutch Parallel Datasets

English Parallel Datasets

Finnish Parallel Datasets

French Parallel Datasets

German Parallel Datasets

Gujarati Parallel Datasets

Hindi Parallel Datasets

Italian Parallel Datasets

Japanese Parallel Datasets

Kannada Parallel Datasets

Korean Parallel Datasets

Malay Parallel Datasets

Malayalam Parallel Datasets

Mandarin Parallel Datasets

Marathi Parallel Datasets

Norwegian Parallel Datasets

Odia Parallel Datasets

Polish Parallel Datasets

Portuguese Parallel Datasets

Punjabi Parallel Datasets

Romanian Parallel Datasets

Russian Parallel Datasets

Spanish Parallel Datasets

Swedish Parallel Datasets

Filipino Parallel Datasets

Tamil Parallel Datasets

Telugu Parallel Datasets

Thai Parallel Datasets

Turkish Parallel Datasets

Ukrainian Parallel Datasets

Urdu Parallel Datasets

Vietnamese Parallel Datasets

Train & Fine-tune Neural Machine Translation models with Multi-lingual Parallel Corpus!