Mandarin Speech Datasets

Explore the collection of mandarin language speech datasets! It includes diverse range of speech data like General Conversation, Call Center Conversation, Scripted Monologues, Wake words and Commands.

Leverage these ready-to-deploy mandarin language audio datasets in building robust Automatic Speech Recognition (ASR), Text-to-Speech (TTS), Conversational AI, and Voice assistant models.

Each voice dataset includes high-quality and realistic audio data, accurate transcription, and detailed metadata!

Decorative Lines

Wake Words & Voice Command Datasets

Wake words & Command dataset for training & fine-tuning of voice assistants in Mandarin (China)

Mandarin (China)

Mandarin Wake Word & Command Audio Data

Mandarin audio dataset featuring wake words and short commands.

20000+ Recordings

Wake Word DetectionCommand Recognition

TTS Speech Datasets

Mandarin Chinese TTS dataset for AI voice generation

Mandarin (China)

Mandarin Chinese TTS Dataset for Speech Synthesis

Studio-quality Mandarin Chinese speech dataset featuring expressive recordings by native speakers.

53 Speech Hours

TTSLanguage Modelling

In-Car Speech Datasets

Mandarin In-car speech dataset

Mandarin (China)

Mandarin In-car Speech Dataset

Automobile-specific wake words & commands in the in-car environment.

5000+ Recordings

In-car ASRDriver Assistance

General Conversation Speech Datasets

Mandarin Chinese conversational AI dataset for speech training

Mandarin (China)

Mandarin General Conversation Speech Data

Spontaneous two-speaker general conversations in Mandarin

50 Speech Hours

ASRConversational AI

Retail & E-Commerce Call Center Speech Datasets

AI voice dataset for Retail and E-commerce in Mandarin (China)

Mandarin (China)

Mandarin Retail & E-com CC Speech Data

Retail & E-commerce call center audio data in Mandarin Chinese.

30 Speech Hours

BFSI Call Center Speech Datasets

AI voice dataset for BFSI in Mandarin (China)

Mandarin (China)

Mandarin BFSI CC Speech Data

BFSI call center audio data in Mandarin Chinese.

30 Speech Hours

Telecom Call Center Speech Datasets

AI voice dataset for Telecom in Mandarin (China)

Mandarin (China)

Mandarin Telecom CC Speech Data

Telecom call center audio data in Mandarin Chinese.

30 Speech Hours

Delivery & Logistics Call Center Speech Datasets

AI voice dataset for Delivery & Logistics in Mandarin (China)

Mandarin (China)

Mandarin Delivery & Lgc CC Speech Data

Delivery & Logistics call center audio data in Mandarin Chinese.

30 Speech Hours

Healthcare Call Center Speech Datasets

AI voice dataset for Healthcare in Mandarin (China)

Mandarin (China)

Mandarin Healthcare CC Speech Data

Healthcare call center audio data in Mandarin Chinese.

30 Speech Hours

Real Estate Call Center Speech Datasets

AI voice dataset for Realestate in Mandarin (China)

Mandarin (China)

Mandarin Real Estate CC Speech Data

Real Estate call center audio data in Mandarin Chinese.

30 Speech Hours

Travel Call Center Speech Datasets

AI voice dataset for Travel in Mandarin (China)

Mandarin (China)

Mandarin Travel CC Speech Data

Travel call center audio data in Mandarin Chinese.

30 Speech Hours

Enhance your Speech Model’s performance with Multi-lingual Speech datasets!

CTA illustration