Gujarati (India) Call Center Speech Dataset for BFSI

The audio dataset includes call center conversations in BFSI, featuring native Gujarati speakers from India, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

July 2023

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Gujarati Language Call Center Speech Dataset for the BFSI domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the BFSI industry.


With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the BFSI domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Gujarati language spoken in India.


Speech Data:

This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the BFSI domain, to build robust and accurate customer service speech technology.


To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Gujarati speakers from different part of Gujarat. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.


Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.


The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.


Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.


The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Gujarati language call center speech recognition models for the BFSI domain.


Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.


These ready-to-use transcriptions accelerate the development of BFSI call center conversational AI and ASR models for the Gujarati language.


Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.


If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.


License:

This BFSI call center audio dataset is created by FutureBeeAI and is available for commercial use!


Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the BFSI sector, our dataset serves as a trusted resource to meet your goals


Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Male(20)Male(25)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.1000.650Speaker 1<lang:Foreign>Hello</lang:Foreign>
Speech1.7502.400Speaker 2<lang:Foreign>Hello</lang:Foreign>
Speech3.2254.400Speaker 1હા જી નમસ્તે
Speech6.2757.525Speaker 2હા કોન બોલો?
Speech8.0258.950Speaker 1ભાવિનભાઈ બોલે?
Speech10.67511.800Speaker 2હાં હાં બોલોને
Speech11.80015.425Speaker 1હાં, ભાવિનભાઈ હું અત્યારે હાલ <lang:Foreign>Axis Bank</lang:Foreign> માંથી બોલી રહીયો છું.
Speech17.65018.850Speaker 2 હા હા સાહેબ બોલોને
Speech18.50023.050Speaker 1તમારે આપણે ઘણા સમયથી <lang:Foreign>Axis bank</lang:Foreign> ની અંદર આપણે ખાતુ ચાલુ છે
Speech25.70026.475Speaker 2હા હા
Speech26.53038.580Speaker 1હવે તમે #આહ <lang:Foreign>bank</lang:Foreign> નો ઉપયોગ તમે કઈ કઈ જગ્યાએ કરો છો, મતલબ કે પૈસા લેવડ દેવળમાં કઈ કઈ રીતે તમે કરો છો આ <lang:Foreign>bank</lang:Foreign>થી <lang:Foreign>direct fund</lang:Foreign> ક્યારેય તમે <lang:Foreign>transfer</lang:Foreign> કરો છો કે નહિ?
Speech41.86049.635Speaker 2ના ના સાહેબ <lang:Foreign>fund</lang:Foreign> તો <lang:Foreign>transfer</lang:Foreign> અમે ઘણી ફેરી કરીએ, મારો પોતાનું <lang:Foreign>builder</lang:Foreign> નો <lang:Foreign>business</lang:Foreign> છે એટલે વધારે હું <lang:Foreign>Axis bank</lang:Foreign> નો જ <lang:Foreign>use</lang:Foreign> કરું છું.
Speech49.46055.235Speaker 1હવે, ભાવિનભાઈ તમારા માટે ઘણું બધું <lang:Foreign>fund</lang:Foreign> તમે <lang:Foreign>transfer</lang:Foreign> કરો છો એવું <lang:Foreign>bank</lang:Foreign> માં <lang:Foreign>record</lang:Foreign> મા આવ્યું છે.
Speech55.93560.960Speaker 1એટલે અમે છે ને, <lang:Foreign>bank</lang:Foreign> માં અમુક <lang:Foreign>selected</lang:Foreign> માણસો રાખેલા હોયે છે.
Speech57.76058.560Speaker 2હા હા સાહેબ
Speech61.41066.435Speaker 1અને આ માણસોને વારાફર્તી વારાફર્તી બધા માટે એક <lang:Foreign>offer</lang:Foreign> આવે છે
Speech64.36065.160Speaker 2હા હા
Speech69.13575.185Speaker 1હવે આ <lang:Foreign>offer</lang:Foreign> તમારા માટે એવી છે કે, તમને એક #આહ <lang:Foreign>fast and secure</lang:Foreign> અને એક #આહ
Speech70.40571.155Speaker 2હા હા
Speech75.55578.855Speaker 1<lang:Foreign>special</lang:Foreign> આમ <lang:Foreign>security</lang:Foreign> વાળું જ તમે કહી શકો છો આવું એક <lang:Foreign>credit card</lang:Foreign>
Speech80.75584.580Speaker 1જે નવું <lang:Foreign>launch</lang:Foreign> થયું છે આપણી <lang:Foreign>bank</lang:Foreign>ની આપણી જ શાખા આપણે
Speech83.33084.005Speaker 2હા હા સાહેબ
Speech84.60585.480Speaker 2હા હા સાહેબ
Speech87.38088.205Speaker 2હા હા સાહેબ
Speech87.58094.380Speaker 1તો તમારે <lang:Foreign>credit card</lang:Foreign> તમે આ તમને મળશે ઘરે <lang:Foreign>direct</lang:Foreign> આવી જશે <lang:Foreign>post office</lang:Foreign> માંથી
Speech97.205104.455Speaker 1તમને પાંચ દિવસ ની અંદર તમને આ <lang:Foreign>credit card</lang:Foreign> મળી જશે, તમારા ઘર ની જે <lang:Foreign>address</lang:Foreign> તમે આમા નાખેલુ છે એ <lang:Foreign>address</lang:Foreign> ઉપર આવી જશે
Speech98.03098.955Speaker 2હા હા સાહેબ
Speech106.355112.980Speaker 1તો તમને બે દિવસ પહેલા જે <lang:Foreign>mail</lang:Foreign> આવ્યો હતો તમે જરા <lang:Foreign>check</lang:Foreign> કરીને મને જે છો આંકડાનો <lang:Foreign>digits</lang:Foreign> હોય છે જે <lang:Foreign><initial>OTP</initial></lang:Foreign>
Speech108.330109.380Speaker 2હા હા
Speech116.930117.755Speaker 2હા હા સાહેબ
Speech117.080123.880Speaker 1કાલે પણ મેં તમને <lang:Foreign>mail</lang:Foreign> કરેલો પણ અત્યારે <lang:Foreign>भी</lang:Foreign> કરેલો છે તો તમે ફટાફટ મને છ આંકડા જણાવી આપો પછી હું તમને આગળ ની વિગતો કહું
Speech126.930133.930Speaker 2ના સાહેબ પહેલા મને ઈ જણાવો કે <lang:Foreign>credit card</lang:Foreign> માં <lang:Foreign>facility</lang:Foreign> શું આવે, એની <lang:Foreign>credit limit</lang:Foreign> કેટલી આવે?
Speech134.630138.480Speaker 2એવું બધું તો તમે મને જણાવો બધું, પછી આપણે આગળ વધીએ
Speech137.405138.055Speaker 1અચ્છા
Speech139.205146.655Speaker 1હવે ભાવિનભાઈ એમાં એવું છે કે <lang:Foreign>credit card</lang:Foreign> છે ને આ બીજી બધી <lang:Foreign>bank</lang:Foreign> ઓ કરતા <lang:Foreign>Axis Bank</lang:Foreign> છે <lang:Foreign>full secure credit card</lang:Foreign> આપે છે
Speech147.305148.680Speaker 1અને બીજા <lang:Foreign>number</lang:Foreign> માં
Speech149.480150.455Speaker 2ના ના એ તો છે
Speech150.105150.880Speaker 1હા હા
Speech151.605155.355Speaker 2હાં એ તો ખ્યાલ છે મને, એ તો એટલે જ <lang:Foreign>account</lang:Foreign> રાખ્યું હોય ને આપણે એમાં
Speech156.255168.555Speaker 1બીજા <lang:Foreign>number</lang:Foreign> મા આપણે <lang:Foreign>credit card</lang:Foreign> છે જે અત્યારે તમે જોઈ લીધું છે આપણા <lang:Foreign>digital</lang:Foreign> યુગની અંદર <lang:Foreign>credit card</lang:Foreign> નો ઘણો બધો <lang:Foreign>craze</lang:Foreign> છે, કેમકે ઘણો બધો <lang:Foreign>credit card</lang:Foreign> છે તે ઘણા બધા ફાયદા આપે છે
Speech161.730162.355Speaker 2હા હા
Speech171.180179.680Speaker 1મહત્તમ ફાયદા આપે છે કે તમે <lang:Foreign>credit card</lang:Foreign> છે ને મોટા ભાગે <lang:Foreign>Axis Bank</lang:Foreign> છે ને એવું <lang:Foreign>credit card</lang:Foreign> અત્યારે બહાર છે પાળે છે કે તેમાં
Speech171.780172.680Speaker 2હા હા સાહેબ

TRANSCRIPTION

TIMETRANSCRIPT
0.100
0.650
<lang:Foreign>Hello</lang:Foreign>
1.750
2.400
<lang:Foreign>Hello</lang:Foreign>
3.225
4.400
હા જી નમસ્તે
6.275
7.525
હા કોન બોલો?
8.025
8.950
ભાવિનભાઈ બોલે?
10.675
11.800
હાં હાં બોલોને
11.800
15.425
હાં, ભાવિનભાઈ હું અત્યારે હાલ <lang:Foreign>Axis Bank</lang:Foreign> માંથી બોલી રહીયો છું.
17.650
18.850
હા હા સાહેબ બોલોને
18.500
23.050
તમારે આપણે ઘણા સમયથી <lang:Foreign>Axis bank</lang:Foreign> ની અંદર આપણે ખાતુ ચાલુ છે
25.700
26.475
હા હા
26.530
38.580
હવે તમે #આહ <lang:Foreign>bank</lang:Foreign> નો ઉપયોગ તમે કઈ કઈ જગ્યાએ કરો છો, મતલબ કે પૈસા લેવડ દેવળમાં કઈ કઈ રીતે તમે કરો છો આ <lang:Foreign>bank</lang:Foreign>થી <lang:Foreign>direct fund</lang:Foreign> ક્યારેય તમે <lang:Foreign>transfer</lang:Foreign> કરો છો કે નહિ?
41.860
49.635
ના ના સાહેબ <lang:Foreign>fund</lang:Foreign> તો <lang:Foreign>transfer</lang:Foreign> અમે ઘણી ફેરી કરીએ, મારો પોતાનું <lang:Foreign>builder</lang:Foreign> નો <lang:Foreign>business</lang:Foreign> છે એટલે વધારે હું <lang:Foreign>Axis bank</lang:Foreign> નો જ <lang:Foreign>use</lang:Foreign> કરું છું.
49.460
55.235
હવે, ભાવિનભાઈ તમારા માટે ઘણું બધું <lang:Foreign>fund</lang:Foreign> તમે <lang:Foreign>transfer</lang:Foreign> કરો છો એવું <lang:Foreign>bank</lang:Foreign> માં <lang:Foreign>record</lang:Foreign> મા આવ્યું છે.
55.935
60.960
એટલે અમે છે ને, <lang:Foreign>bank</lang:Foreign> માં અમુક <lang:Foreign>selected</lang:Foreign> માણસો રાખેલા હોયે છે.
57.760
58.560
હા હા સાહેબ
61.410
66.435
અને આ માણસોને વારાફર્તી વારાફર્તી બધા માટે એક <lang:Foreign>offer</lang:Foreign> આવે છે
64.360
65.160
હા હા
69.135
75.185
હવે આ <lang:Foreign>offer</lang:Foreign> તમારા માટે એવી છે કે, તમને એક #આહ <lang:Foreign>fast and secure</lang:Foreign> અને એક #આહ
70.405
71.155
હા હા
75.555
78.855
<lang:Foreign>special</lang:Foreign> આમ <lang:Foreign>security</lang:Foreign> વાળું જ તમે કહી શકો છો આવું એક <lang:Foreign>credit card</lang:Foreign>
80.755
84.580
જે નવું <lang:Foreign>launch</lang:Foreign> થયું છે આપણી <lang:Foreign>bank</lang:Foreign>ની આપણી જ શાખા આપણે
83.330
84.005
હા હા સાહેબ
84.605
85.480
હા હા સાહેબ
87.380
88.205
હા હા સાહેબ
87.580
94.380
તો તમારે <lang:Foreign>credit card</lang:Foreign> તમે આ તમને મળશે ઘરે <lang:Foreign>direct</lang:Foreign> આવી જશે <lang:Foreign>post office</lang:Foreign> માંથી
97.205
104.455
તમને પાંચ દિવસ ની અંદર તમને આ <lang:Foreign>credit card</lang:Foreign> મળી જશે, તમારા ઘર ની જે <lang:Foreign>address</lang:Foreign> તમે આમા નાખેલુ છે એ <lang:Foreign>address</lang:Foreign> ઉપર આવી જશે
98.030
98.955
હા હા સાહેબ
106.355
112.980
તો તમને બે દિવસ પહેલા જે <lang:Foreign>mail</lang:Foreign> આવ્યો હતો તમે જરા <lang:Foreign>check</lang:Foreign> કરીને મને જે છો આંકડાનો <lang:Foreign>digits</lang:Foreign> હોય છે જે <lang:Foreign><initial>OTP</initial></lang:Foreign>
108.330
109.380
હા હા
116.930
117.755
હા હા સાહેબ
117.080
123.880
કાલે પણ મેં તમને <lang:Foreign>mail</lang:Foreign> કરેલો પણ અત્યારે <lang:Foreign>भी</lang:Foreign> કરેલો છે તો તમે ફટાફટ મને છ આંકડા જણાવી આપો પછી હું તમને આગળ ની વિગતો કહું
126.930
133.930
ના સાહેબ પહેલા મને ઈ જણાવો કે <lang:Foreign>credit card</lang:Foreign> માં <lang:Foreign>facility</lang:Foreign> શું આવે, એની <lang:Foreign>credit limit</lang:Foreign> કેટલી આવે?
134.630
138.480
એવું બધું તો તમે મને જણાવો બધું, પછી આપણે આગળ વધીએ
137.405
138.055
અચ્છા
139.205
146.655
હવે ભાવિનભાઈ એમાં એવું છે કે <lang:Foreign>credit card</lang:Foreign> છે ને આ બીજી બધી <lang:Foreign>bank</lang:Foreign> ઓ કરતા <lang:Foreign>Axis Bank</lang:Foreign> છે <lang:Foreign>full secure credit card</lang:Foreign> આપે છે
147.305
148.680
અને બીજા <lang:Foreign>number</lang:Foreign> માં
149.480
150.455
ના ના એ તો છે
150.105
150.880
હા હા
151.605
155.355
હાં એ તો ખ્યાલ છે મને, એ તો એટલે જ <lang:Foreign>account</lang:Foreign> રાખ્યું હોય ને આપણે એમાં
156.255
168.555
બીજા <lang:Foreign>number</lang:Foreign> મા આપણે <lang:Foreign>credit card</lang:Foreign> છે જે અત્યારે તમે જોઈ લીધું છે આપણા <lang:Foreign>digital</lang:Foreign> યુગની અંદર <lang:Foreign>credit card</lang:Foreign> નો ઘણો બધો <lang:Foreign>craze</lang:Foreign> છે, કેમકે ઘણો બધો <lang:Foreign>credit card</lang:Foreign> છે તે ઘણા બધા ફાયદા આપે છે
161.730
162.355
હા હા
171.180
179.680
મહત્તમ ફાયદા આપે છે કે તમે <lang:Foreign>credit card</lang:Foreign> છે ને મોટા ભાગે <lang:Foreign>Axis Bank</lang:Foreign> છે ને એવું <lang:Foreign>credit card</lang:Foreign> અત્યારે બહાર છે પાળે છે કે તેમાં
171.780
172.680
હા હા સાહેબ

Dataset Demographics

Details Headline

Language

Gujarati

Language code

gu-in

Country

India

Accents

Kathiawari,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg