Marathi (India) Call Center Speech Dataset for Retail & E-commerce

The audio dataset includes call center conversations in Retail & E-commerce, featuring native Marathi speakers from India, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

40 Speech Hours

Last updated

July 2023

Number of participants

80

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Marathi Language Call Center Speech Dataset for the Retail and E-commerce domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Retail and E-commerce industry.


With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Retail and E-commerce domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Marathi language spoken in India.


Speech Data:

This training dataset comprises 40 hours of call center audio recordings covering various topics and scenarios related to the Retail and E-commerce domain, to build robust and accurate customer service speech technology.


To curate realistic call center interactions, we collaborated with a diverse network of 80 expert native Marathi speakers from different part of Maharashtra. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.


Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.


The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.


Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.


The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Marathi language call center speech recognition models for the Retail and E-commerce domain.


Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.


These ready-to-use transcriptions accelerate the development of Retail and E-commerce call center conversational AI and ASR models for the Marathi language.


Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.


If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.


License:

This Retail and E-commerce call center audio dataset is created by FutureBeeAI and is available for commercial use!


Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Retail and E-commerce sector, our dataset serves as a trusted resource to meet your goals


Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Female(44)Male(47)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.0251.250Speaker 1<lang:Foreign>hello Futurebee</lang:Foreign>
Speech2.7984.125Speaker 2<lang:Foreign>hello Futurebee</lang:Foreign>
Speech4.7505.400Speaker 1नमस्कार
Speech5.77510.625Speaker 1विजय <lang:Foreign>sales</lang:Foreign> च्या <lang:Foreign>call center</lang:Foreign> मध्ये आपलं स्वागत आहे. मी <PII>अमृता</PII> आपली काय मदत करू शकते <lang:Foreign>sir</lang:Foreign>
Speech12.15016.824Speaker 2<lang:Foreign>madam</lang:Foreign> मला ते जे (()) आणि <lang:Foreign>food processor</lang:Foreign> पाठवला आहे (())
Speech17.14921.675Speaker 1[filler]नाही नाही <lang:Foreign>sir</lang:Foreign> नक्की काय झालंय मला जरा <lang:Foreign>detail</lang:Foreign> मध्ये सांगू शकता का?
Speech23.22529.875Speaker 2<lang:Foreign>madam</lang:Foreign> दोन दिवसापूर्वी मी तुमच्या <lang:Foreign>market</lang:Foreign> ला (()) तिथं मी <lang:Foreign>food processor</lang:Foreign> पाहिला <lang:Foreign>fridge</lang:Foreign> पाहिला.
Speech30.27430.875Speaker 1[filler]
Speech30.55031.475Speaker 2आणि
Speech32.32536.000Speaker 2त्याची <lang:Foreign>order</lang:Foreign> नोंदवली. माझ्याकडे आलेली आहे.
Speech36.42339.798Speaker 2<lang:Foreign>food processor</lang:Foreign>चं एक भांडं गायब आहे ज्याला <lang:Foreign>juicer</lang:Foreign> म्हणतात.
Speech41.10041.825Speaker 1बरं.
Speech41.29843.250Speaker 2ते <lang:Foreign>juicer</lang:Foreign> मला दिले गेलं नाहीये.
Speech44.17345.149Speaker 1[filler]
Speech44.92348.923Speaker 2तिथे दाखवताना मला सगळी भांडी दाखवली तिथं त्या (())
Speech49.32551.774Speaker 2<lang:Foreign>box</lang:Foreign> घरी आले त्या <lang:Foreign>box</lang:Foreign> वर सगळे (())
Speech52.12554.600Speaker 2काय काय आतमध्ये आहे ते सगळं आहे.
Speech55.25058.149Speaker 2आणि आतमध्ये बघायला गेलं तर एक भांडं नाहीये.
Speech58.35061.100Speaker 1अच्छा <lang:Foreign>sir</lang:Foreign> मला तुमचं पूर्ण नाव सांगता?
Speech63.87565.224Speaker 2<PII>मंदार जोशी.</PII>
Speech64.67466.650Speaker 1बरं. तुमचा <lang:Foreign>mobile number</lang:Foreign> सांगता <lang:Foreign>sir</lang:Foreign>
Speech69.95071.200Speaker 2 <PII>सत्तर बहात्तर</PII>
Speech70.62571.025Speaker 1[filler]
Speech72.37574.775Speaker 2 <PII>चाळीस चव्वेचाळीस त्रेपन्न</PII>
Speech72.70073.250Speaker 1[filler]
Speech74.62581.549Speaker 1बरं <lang:Foreign>sir</lang:Foreign> मी <lang:Foreign>database</lang:Foreign> मध्ये बघते आहे की तुम्ही आमच्याकडून एक तीन दिवसापूर्वीच या दोन्ही गोष्टी खरेदी केलेल्या आहेत.
Speech81.57585.875Speaker 1आमची जी <lang:Foreign>market yard</lang:Foreign>ची जी शाखा आहे तिकडनं तुम्ही या गोष्टी घेतल्यात.
Speech85.90090.849Speaker 1आणि मला सांगायला खरंतर एक गोष्ट फारच अभिमानास्पद वाटते आहे की तुम्ही आमचे एक
Speech90.90098.799Speaker 1<lang:Foreign>golden customer</lang:Foreign> आहात. गेल्या अनेक वर्षांपासून तुम्ही विजय <lang:Foreign>sales</lang:Foreign> मधनं वेगवेगळे <lang:Foreign>home appliance</lang:Foreign> खरेदी केलेले आहेत. बरोबर <lang:Foreign>sir</lang:Foreign>?
Speech101.325104.000Speaker 2अहो पण असा अनुभव कधीच आलेला नाहीये.
Speech104.924108.625Speaker 2ती माझी बायको भडकली आहे. ती म्हणतीये असला गळका <lang:Foreign>fridge</lang:Foreign> नको आपल्याला.
Speech108.875113.775Speaker 2हे भांडं पण नको काही आपल्याला याचे. <lang:Foreign>food processor</lang:Foreign> सगळं परत करून टाका.
Speech113.674116.224Speaker 1नाही नाही <lang:Foreign>sir</lang:Foreign> तुम्हाला परत करायची
Speech115.799120.000Speaker 2असं होत नाही ना <lang:Foreign>madam</lang:Foreign> आता एवढी वर्ष प्रत्येक वेळेला काहीही घ्यायचं असलं तर
Speech120.125124.750Speaker 2बरं. मला सांगा माझ्या घराच्या आसपास एवढी दुकानं असताना ती सोडून मी विजय <lang:Foreign>sales</lang:Foreign>ला येतो की नाही?
Speech125.375126.299Speaker 1हो <lang:Foreign>sir</lang:Foreign> (())
Speech125.974128.300Speaker 2एकतर मला <lang:Foreign>service</lang:Foreign> चांगली मिळते.
Speech128.875133.775Speaker 2तिथले सगळे <lang:Foreign>home appliances</lang:Foreign> किंवा जे काही मी तिथून घेतो ते सगळं चांगलं असतं.
Speech134.925138.650Speaker 2<lang:Foreign>quality</lang:Foreign> आणि <lang:Foreign>overall service</lang:Foreign> याच्यासाठी मी तुमच्याकडे येतो की नाही?
Speech139.050148.074Speaker 1बरोबर म्हणताय <lang:Foreign>sir</lang:Foreign> तुम्ही [filler] तुमचं म्हणणं अगदी बरोबर आहे. [filler] मला सांगा की तुम्हाला [filler] जो <lang:Foreign>food processor</lang:Foreign> घेतलेला आहे त्याच्यामध्ये <lang:Foreign>juicer</lang:Foreign>चं भांडं आलेलं नाहीये.
Speech150.125150.973Speaker 2बरोबर.
Speech150.199158.598Speaker 1मी <lang:Foreign>dispatch department</lang:Foreign>चा <lang:Foreign>mail check</lang:Foreign> करते आहे. त्याच्या म्हणण्या नुसार तरी तुम्हाला ते भांडं देण्यात आलेलं आहे <lang:Foreign>sir</lang:Foreign> म्हणजे त्यांचं म्हणणं आहे
Speech159.025161.650Speaker 2मग ते गेलं कुठे? त्यांनी दिलेलं आहे तर ते गेलं कुठं?
Speech161.775169.574Speaker 1[filler]<lang:Foreign>sir</lang:Foreign> मी पुन्हा एकदा हा <lang:Foreign>mail raise</lang:Foreign> केलेला आहे की तुमचा जो <lang:Foreign>number</lang:Foreign> आहे <lang:Foreign>invoice number</lang:Foreign> तो तुम्हाला पाठवून दिलेला आहे.
Speech169.598175.574Speaker 1<lang:Foreign>sir</lang:Foreign> मला एक फक्त सांगा की जेव्हा तुमच्याकडे [filler] या गोष्टी आल्या तेव्हा तुम्ही घरी होतात का <lang:Foreign>sir</lang:Foreign>

TRANSCRIPTION

TIMETRANSCRIPT
0.025
1.250
<lang:Foreign>hello Futurebee</lang:Foreign>
2.798
4.125
<lang:Foreign>hello Futurebee</lang:Foreign>
4.750
5.400
नमस्कार
5.775
10.625
विजय <lang:Foreign>sales</lang:Foreign> च्या <lang:Foreign>call center</lang:Foreign> मध्ये आपलं स्वागत आहे. मी <PII>अमृता</PII> आपली काय मदत करू शकते <lang:Foreign>sir</lang:Foreign>
12.150
16.824
<lang:Foreign>madam</lang:Foreign> मला ते जे (()) आणि <lang:Foreign>food processor</lang:Foreign> पाठवला आहे (())
17.149
21.675
[filler]नाही नाही <lang:Foreign>sir</lang:Foreign> नक्की काय झालंय मला जरा <lang:Foreign>detail</lang:Foreign> मध्ये सांगू शकता का?
23.225
29.875
<lang:Foreign>madam</lang:Foreign> दोन दिवसापूर्वी मी तुमच्या <lang:Foreign>market</lang:Foreign> ला (()) तिथं मी <lang:Foreign>food processor</lang:Foreign> पाहिला <lang:Foreign>fridge</lang:Foreign> पाहिला.
30.274
30.875
[filler]
30.550
31.475
आणि
32.325
36.000
त्याची <lang:Foreign>order</lang:Foreign> नोंदवली. माझ्याकडे आलेली आहे.
36.423
39.798
<lang:Foreign>food processor</lang:Foreign>चं एक भांडं गायब आहे ज्याला <lang:Foreign>juicer</lang:Foreign> म्हणतात.
41.100
41.825
बरं.
41.298
43.250
ते <lang:Foreign>juicer</lang:Foreign> मला दिले गेलं नाहीये.
44.173
45.149
[filler]
44.923
48.923
तिथे दाखवताना मला सगळी भांडी दाखवली तिथं त्या (())
49.325
51.774
<lang:Foreign>box</lang:Foreign> घरी आले त्या <lang:Foreign>box</lang:Foreign> वर सगळे (())
52.125
54.600
काय काय आतमध्ये आहे ते सगळं आहे.
55.250
58.149
आणि आतमध्ये बघायला गेलं तर एक भांडं नाहीये.
58.350
61.100
अच्छा <lang:Foreign>sir</lang:Foreign> मला तुमचं पूर्ण नाव सांगता?
63.875
65.224
<PII>मंदार जोशी.</PII>
64.674
66.650
बरं. तुमचा <lang:Foreign>mobile number</lang:Foreign> सांगता <lang:Foreign>sir</lang:Foreign>
69.950
71.200
<PII>सत्तर बहात्तर</PII>
70.625
71.025
[filler]
72.375
74.775
<PII>चाळीस चव्वेचाळीस त्रेपन्न</PII>
72.700
73.250
[filler]
74.625
81.549
बरं <lang:Foreign>sir</lang:Foreign> मी <lang:Foreign>database</lang:Foreign> मध्ये बघते आहे की तुम्ही आमच्याकडून एक तीन दिवसापूर्वीच या दोन्ही गोष्टी खरेदी केलेल्या आहेत.
81.575
85.875
आमची जी <lang:Foreign>market yard</lang:Foreign>ची जी शाखा आहे तिकडनं तुम्ही या गोष्टी घेतल्यात.
85.900
90.849
आणि मला सांगायला खरंतर एक गोष्ट फारच अभिमानास्पद वाटते आहे की तुम्ही आमचे एक
90.900
98.799
<lang:Foreign>golden customer</lang:Foreign> आहात. गेल्या अनेक वर्षांपासून तुम्ही विजय <lang:Foreign>sales</lang:Foreign> मधनं वेगवेगळे <lang:Foreign>home appliance</lang:Foreign> खरेदी केलेले आहेत. बरोबर <lang:Foreign>sir</lang:Foreign>?
101.325
104.000
अहो पण असा अनुभव कधीच आलेला नाहीये.
104.924
108.625
ती माझी बायको भडकली आहे. ती म्हणतीये असला गळका <lang:Foreign>fridge</lang:Foreign> नको आपल्याला.
108.875
113.775
हे भांडं पण नको काही आपल्याला याचे. <lang:Foreign>food processor</lang:Foreign> सगळं परत करून टाका.
113.674
116.224
नाही नाही <lang:Foreign>sir</lang:Foreign> तुम्हाला परत करायची
115.799
120.000
असं होत नाही ना <lang:Foreign>madam</lang:Foreign> आता एवढी वर्ष प्रत्येक वेळेला काहीही घ्यायचं असलं तर
120.125
124.750
बरं. मला सांगा माझ्या घराच्या आसपास एवढी दुकानं असताना ती सोडून मी विजय <lang:Foreign>sales</lang:Foreign>ला येतो की नाही?
125.375
126.299
हो <lang:Foreign>sir</lang:Foreign> (())
125.974
128.300
एकतर मला <lang:Foreign>service</lang:Foreign> चांगली मिळते.
128.875
133.775
तिथले सगळे <lang:Foreign>home appliances</lang:Foreign> किंवा जे काही मी तिथून घेतो ते सगळं चांगलं असतं.
134.925
138.650
<lang:Foreign>quality</lang:Foreign> आणि <lang:Foreign>overall service</lang:Foreign> याच्यासाठी मी तुमच्याकडे येतो की नाही?
139.050
148.074
बरोबर म्हणताय <lang:Foreign>sir</lang:Foreign> तुम्ही [filler] तुमचं म्हणणं अगदी बरोबर आहे. [filler] मला सांगा की तुम्हाला [filler] जो <lang:Foreign>food processor</lang:Foreign> घेतलेला आहे त्याच्यामध्ये <lang:Foreign>juicer</lang:Foreign>चं भांडं आलेलं नाहीये.
150.125
150.973
बरोबर.
150.199
158.598
मी <lang:Foreign>dispatch department</lang:Foreign>चा <lang:Foreign>mail check</lang:Foreign> करते आहे. त्याच्या म्हणण्या नुसार तरी तुम्हाला ते भांडं देण्यात आलेलं आहे <lang:Foreign>sir</lang:Foreign> म्हणजे त्यांचं म्हणणं आहे
159.025
161.650
मग ते गेलं कुठे? त्यांनी दिलेलं आहे तर ते गेलं कुठं?
161.775
169.574
[filler]<lang:Foreign>sir</lang:Foreign> मी पुन्हा एकदा हा <lang:Foreign>mail raise</lang:Foreign> केलेला आहे की तुमचा जो <lang:Foreign>number</lang:Foreign> आहे <lang:Foreign>invoice number</lang:Foreign> तो तुम्हाला पाठवून दिलेला आहे.
169.598
175.574
<lang:Foreign>sir</lang:Foreign> मला एक फक्त सांगा की जेव्हा तुमच्याकडे [filler] या गोष्टी आल्या तेव्हा तुम्ही घरी होतात का <lang:Foreign>sir</lang:Foreign>

Dataset Demographics

Details Headline

Language

Marathi

Language code

mr-in

Country

India

Accents

Varhadi,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg