Marathi (India) Call Center Speech Dataset for BFSI

The audio dataset includes call center conversations in BFSI, featuring native Marathi speakers from India, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

40 Speech Hours

Last updated

July 2023

Number of participants

80

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Marathi Language Call Center Speech Dataset for the BFSI domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the BFSI industry.


With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the BFSI domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Marathi language spoken in India.


Speech Data:

This training dataset comprises 40 hours of call center audio recordings covering various topics and scenarios related to the BFSI domain, to build robust and accurate customer service speech technology.


To curate realistic call center interactions, we collaborated with a diverse network of 80 expert native Marathi speakers from different part of Maharashtra. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.


Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.


The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.


Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.


The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Marathi language call center speech recognition models for the BFSI domain.


Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.


These ready-to-use transcriptions accelerate the development of BFSI call center conversational AI and ASR models for the Marathi language.


Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.


If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.


License:

This BFSI call center audio dataset is created by FutureBeeAI and is available for commercial use!


Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the BFSI sector, our dataset serves as a trusted resource to meet your goals


Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Male(21)Female(56)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.0000.850Speaker 2<lang:Foreign>Futurebee</lang:Foreign>
Speech1.7503.149Speaker 1<lang:Foreign>hello Futurebee</lang:Foreign>
Speech5.54913.974Speaker 2[filler]मी बँकेकडनं <lang:Foreign>phone</lang:Foreign> करतीये तुम्हाला. तुमचे <lang:Foreign>queries</lang:Foreign> काही काही आल्या होत्या तर त्याच्या संदर्भात तुम्हाला [filler] करतीये <lang:Foreign>phone</lang:Foreign>
Speech14.59918.524Speaker 2सगळ्यात पहिले (()) सुप्रभात ते म्हणायची मी विसरली.
Speech20.75023.300Speaker 1[filler]सुप्रभात. बोला तुम्ही कशा आहात?
Speech24.00025.024Speaker 2मी मस्त.
Speech26.69927.725Speaker 2तुम्ही कसे आहेत?
Speech26.92432.225Speaker 1हां मी पण छान आहे. मी तुम्हाला काल मी तुमच्यासाठी तुमच्या बँकेत <lang:Foreign>Email</lang:Foreign> पाठवले होते की
Speech32.64939.475Speaker 1मला<lang:Foreign>property loan</lang:Foreign> <lang:Foreign>home loan</lang:Foreign> आणि<lang:Foreign>Net banking</lang:Foreign>काय तरी <lang:Foreign>issue</lang:Foreign>होता असं तिघांच्या <lang:Foreign>inquiry</lang:Foreign> साठी मी तुम्हाला <lang:Foreign>Email</lang:Foreign> पाठवली होती तर
Speech40.10045.225Speaker 1तर तुम्ही सांगू शकाल की मला त्यासाठी काय <lang:Foreign>problem</lang:Foreign> आहेत आणि जे काही प्रश्न आहेत ते तुम्ही
Speech42.00042.350Speaker 2[filler]
Speech45.75048.225Speaker 1<lang:Foreign>solve</lang:Foreign> करू शकता का? आता (()) <lang:Foreign>phone</lang:Foreign>वरती
Speech46.37547.600Speaker 2तुम्ही (())
Speech48.84849.430Speaker 2हो.
Speech49.70752.399Speaker 2हो मी <lang:Foreign>phone</lang:Foreign>वर तेच्याचसाठी <lang:Foreign>phone</lang:Foreign> केलाय.
Speech52.72354.615Speaker 2मी तुम्हाला <lang:Foreign>education loan</lang:Foreign>
Speech55.01759.225Speaker 2<lang:Foreign>property</lang:Foreign>चं <lang:Foreign>loan</lang:Foreign> आणि <lang:Foreign>net banking</lang:Foreign>चा <lang:Foreign>issue</lang:Foreign> येत होता .
Speech59.77470.200Speaker 2तर सगळ्यात पहिले <lang:Foreign>net banking</lang:Foreign>चा <lang:Foreign>issue</lang:Foreign> काय येतोय तुम्हाला म्हणजे <lang:Foreign>password</lang:Foreign> टाकला का तुम्ही तुमचं बरोबर आहे का तो आधीचा काही होता आणि आता काही वेगळा झालाय असं काही आहे का?
Speech71.17476.650Speaker 1[filler]मी म्हणणार होतो <lang:Foreign>net banking</lang:Foreign> सगळ्यात <lang:Foreign>last</lang:Foreign>सगळ्यात शेवटी <lang:Foreign>discus</lang:Foreign> करू. [filler] तर आधी
Speech76.04976.700Speaker 2बरं.
Speech76.87579.599Speaker 1<lang:Foreign>home loan</lang:Foreign>आणि (()) <lang:Foreign>loan</lang:Foreign>आणि हे
Speech80.45087.049Speaker 1<lang:Foreign>Education loan</lang:Foreign> चं मला माहिती पाहिजे होती तर आधी मी <lang:Foreign>Education loan</lang:Foreign> चं विचारतो तुम्ही माहिती देऊ शकताय <lang:Foreign>Education loan</lang:Foreign> मध्ये काय काय (()) येतंय मला
Speech88.70097.849Speaker 2<lang:Foreign>Education loan</lang:Foreign>मध्ये तुम्हाला <lang:Foreign>university</lang:Foreign> कडनं सगळ्यात पहिलं तुमचं <lang:Foreign>letter</lang:Foreign> लागेल त्यांच्याकडनं की तुम्ही त्याच्या या <lang:Foreign>university</lang:Foreign> मध्ये शिकायला जाताय.
Speech98.224103.224Speaker 2मुख्य म्हणजे कुठल्या <lang:Foreign>country</lang:Foreign> मध्ये तुम्ही जाणार आहे आणि कुठली <lang:Foreign>university</lang:Foreign> <lang:Foreign>select</lang:Foreign> केलीये?
Speech103.888108.737Speaker 2त्या <lang:Foreign>university</lang:Foreign>चं तुम्हाला <lang:Foreign>letter</lang:Foreign> लागेल <lang:Foreign>original letter</lang:Foreign> आणायला लागेल.
Speech109.325110.650Speaker 2नंतर
Speech111.349113.299Speaker 2तुमच्या <lang:Foreign>passport copies</lang:Foreign> लागतील.
Speech113.974116.799Speaker 2आणखी कुठल्या <lang:Foreign>subject</lang:Foreign>मध्ये करणार आहे.
Speech116.925119.775Speaker 2(()) परत तुम्ही <lang:Foreign>repay</lang:Foreign> कसं करणार आहे <lang:Foreign>loan</lang:Foreign>
Speech120.250122.349Speaker 2आणि किती <lang:Foreign>loan</lang:Foreign> हवंय तुम्हाला?
Speech122.825125.174Speaker 2त्याच्या <lang:Foreign>against</lang:Foreign> तुम्ही काय ठेवणार आहे?
Speech126.375128.050Speaker 2<lang:Foreign>Education loan</lang:Foreign>च्या <lang:Foreign>against</lang:Foreign>
Speech128.550130.675Speaker 2की इतके [filler]
Speech131.098135.199Speaker 2आम्हाला बघायला लागेल की तुमच्या <lang:Foreign>account</lang:Foreign>मध्ये किंवा तुमच्याकडे एवढं
Speech135.824138.303Speaker 2[filler]जेवढं तुम्ही <lang:Foreign>loan</lang:Foreign> घेताय त्याच्या <lang:Foreign>against</lang:Foreign>
Speech138.518139.342Speaker 2तेवढं
Speech139.556141.129Speaker 2[filler]तुम्ही
Speech141.973142.625Speaker 2म्हणजे
Speech143.800145.001Speaker 2हे ठेवू शकताय.
Speech145.627146.525Speaker 2[filler]
Speech147.824149.199Speaker 2काय त्याला म्हणता येईल.
Speech153.775160.900Speaker 1[filler]ठीक आहे मी तुम्हाला सांगतो की, माझं मला चाळीस लाखाचा <lang:Foreign>loan</lang:Foreign> पाहिजे. <initial>UT</initial> मध्ये मला <lang:Foreign>admission</lang:Foreign> मिळाले. (()) मध्ये
Speech160.275161.175Speaker 2<lang:Foreign>okay</lang:Foreign>
Speech161.175165.973Speaker 1तर त्याचं माझं एकोणसहा <lang:Foreign>international relations</lang:Foreign> (()) तर मला त्याच्याबद्दल
Speech161.900162.723Speaker 2<lang:Foreign>okay</lang:Foreign>
Speech166.500168.223Speaker 1त्याच्याबद्दली मला <lang:Foreign>loan</lang:Foreign> पाहिजे होता.
Speech168.525171.699Speaker 1तर मला इथं राहण्याचा खर्च <lang:Foreign>college fees</lang:Foreign>
Speech170.173170.853Speaker 2<lang:Foreign>okay</lang:Foreign>
Speech171.229173.125Speaker 2तुम्ही (()) एक मिनिट.
Speech173.473177.223Speaker 2तुम्ही <lang:Foreign>loan</lang:Foreign> घेतल्यानंतर त्याच्या <lang:Foreign>against</lang:Foreign> काय ठेवाल म्हणजे

TRANSCRIPTION

TIMETRANSCRIPT
0.000
0.850
<lang:Foreign>Futurebee</lang:Foreign>
1.750
3.149
<lang:Foreign>hello Futurebee</lang:Foreign>
5.549
13.974
[filler]मी बँकेकडनं <lang:Foreign>phone</lang:Foreign> करतीये तुम्हाला. तुमचे <lang:Foreign>queries</lang:Foreign> काही काही आल्या होत्या तर त्याच्या संदर्भात तुम्हाला [filler] करतीये <lang:Foreign>phone</lang:Foreign>
14.599
18.524
सगळ्यात पहिले (()) सुप्रभात ते म्हणायची मी विसरली.
20.750
23.300
[filler]सुप्रभात. बोला तुम्ही कशा आहात?
24.000
25.024
मी मस्त.
26.699
27.725
तुम्ही कसे आहेत?
26.924
32.225
हां मी पण छान आहे. मी तुम्हाला काल मी तुमच्यासाठी तुमच्या बँकेत <lang:Foreign>Email</lang:Foreign> पाठवले होते की
32.649
39.475
मला<lang:Foreign>property loan</lang:Foreign> <lang:Foreign>home loan</lang:Foreign> आणि<lang:Foreign>Net banking</lang:Foreign>काय तरी <lang:Foreign>issue</lang:Foreign>होता असं तिघांच्या <lang:Foreign>inquiry</lang:Foreign> साठी मी तुम्हाला <lang:Foreign>Email</lang:Foreign> पाठवली होती तर
40.100
45.225
तर तुम्ही सांगू शकाल की मला त्यासाठी काय <lang:Foreign>problem</lang:Foreign> आहेत आणि जे काही प्रश्न आहेत ते तुम्ही
42.000
42.350
[filler]
45.750
48.225
<lang:Foreign>solve</lang:Foreign> करू शकता का? आता (()) <lang:Foreign>phone</lang:Foreign>वरती
46.375
47.600
तुम्ही (())
48.848
49.430
हो.
49.707
52.399
हो मी <lang:Foreign>phone</lang:Foreign>वर तेच्याचसाठी <lang:Foreign>phone</lang:Foreign> केलाय.
52.723
54.615
मी तुम्हाला <lang:Foreign>education loan</lang:Foreign>
55.017
59.225
<lang:Foreign>property</lang:Foreign>चं <lang:Foreign>loan</lang:Foreign> आणि <lang:Foreign>net banking</lang:Foreign>चा <lang:Foreign>issue</lang:Foreign> येत होता .
59.774
70.200
तर सगळ्यात पहिले <lang:Foreign>net banking</lang:Foreign>चा <lang:Foreign>issue</lang:Foreign> काय येतोय तुम्हाला म्हणजे <lang:Foreign>password</lang:Foreign> टाकला का तुम्ही तुमचं बरोबर आहे का तो आधीचा काही होता आणि आता काही वेगळा झालाय असं काही आहे का?
71.174
76.650
[filler]मी म्हणणार होतो <lang:Foreign>net banking</lang:Foreign> सगळ्यात <lang:Foreign>last</lang:Foreign>सगळ्यात शेवटी <lang:Foreign>discus</lang:Foreign> करू. [filler] तर आधी
76.049
76.700
बरं.
76.875
79.599
<lang:Foreign>home loan</lang:Foreign>आणि (()) <lang:Foreign>loan</lang:Foreign>आणि हे
80.450
87.049
<lang:Foreign>Education loan</lang:Foreign> चं मला माहिती पाहिजे होती तर आधी मी <lang:Foreign>Education loan</lang:Foreign> चं विचारतो तुम्ही माहिती देऊ शकताय <lang:Foreign>Education loan</lang:Foreign> मध्ये काय काय (()) येतंय मला
88.700
97.849
<lang:Foreign>Education loan</lang:Foreign>मध्ये तुम्हाला <lang:Foreign>university</lang:Foreign> कडनं सगळ्यात पहिलं तुमचं <lang:Foreign>letter</lang:Foreign> लागेल त्यांच्याकडनं की तुम्ही त्याच्या या <lang:Foreign>university</lang:Foreign> मध्ये शिकायला जाताय.
98.224
103.224
मुख्य म्हणजे कुठल्या <lang:Foreign>country</lang:Foreign> मध्ये तुम्ही जाणार आहे आणि कुठली <lang:Foreign>university</lang:Foreign> <lang:Foreign>select</lang:Foreign> केलीये?
103.888
108.737
त्या <lang:Foreign>university</lang:Foreign>चं तुम्हाला <lang:Foreign>letter</lang:Foreign> लागेल <lang:Foreign>original letter</lang:Foreign> आणायला लागेल.
109.325
110.650
नंतर
111.349
113.299
तुमच्या <lang:Foreign>passport copies</lang:Foreign> लागतील.
113.974
116.799
आणखी कुठल्या <lang:Foreign>subject</lang:Foreign>मध्ये करणार आहे.
116.925
119.775
(()) परत तुम्ही <lang:Foreign>repay</lang:Foreign> कसं करणार आहे <lang:Foreign>loan</lang:Foreign>
120.250
122.349
आणि किती <lang:Foreign>loan</lang:Foreign> हवंय तुम्हाला?
122.825
125.174
त्याच्या <lang:Foreign>against</lang:Foreign> तुम्ही काय ठेवणार आहे?
126.375
128.050
<lang:Foreign>Education loan</lang:Foreign>च्या <lang:Foreign>against</lang:Foreign>
128.550
130.675
की इतके [filler]
131.098
135.199
आम्हाला बघायला लागेल की तुमच्या <lang:Foreign>account</lang:Foreign>मध्ये किंवा तुमच्याकडे एवढं
135.824
138.303
[filler]जेवढं तुम्ही <lang:Foreign>loan</lang:Foreign> घेताय त्याच्या <lang:Foreign>against</lang:Foreign>
138.518
139.342
तेवढं
139.556
141.129
[filler]तुम्ही
141.973
142.625
म्हणजे
143.800
145.001
हे ठेवू शकताय.
145.627
146.525
[filler]
147.824
149.199
काय त्याला म्हणता येईल.
153.775
160.900
[filler]ठीक आहे मी तुम्हाला सांगतो की, माझं मला चाळीस लाखाचा <lang:Foreign>loan</lang:Foreign> पाहिजे. <initial>UT</initial> मध्ये मला <lang:Foreign>admission</lang:Foreign> मिळाले. (()) मध्ये
160.275
161.175
<lang:Foreign>okay</lang:Foreign>
161.175
165.973
तर त्याचं माझं एकोणसहा <lang:Foreign>international relations</lang:Foreign> (()) तर मला त्याच्याबद्दल
161.900
162.723
<lang:Foreign>okay</lang:Foreign>
166.500
168.223
त्याच्याबद्दली मला <lang:Foreign>loan</lang:Foreign> पाहिजे होता.
168.525
171.699
तर मला इथं राहण्याचा खर्च <lang:Foreign>college fees</lang:Foreign>
170.173
170.853
<lang:Foreign>okay</lang:Foreign>
171.229
173.125
तुम्ही (()) एक मिनिट.
173.473
177.223
तुम्ही <lang:Foreign>loan</lang:Foreign> घेतल्यानंतर त्याच्या <lang:Foreign>against</lang:Foreign> काय ठेवाल म्हणजे

Dataset Demographics

Details Headline

Language

Marathi

Language code

mr-in

Country

India

Accents

Varhadi,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg