Gujarati (India) Call Center Speech Dataset for Healthcare

The audio dataset includes call center conversations in Healthcare, featuring native Gujarati speakers from India, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

July 2023

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Gujarati Language Call Center Speech Dataset for the Healthcare domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Healthcare industry.


With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Healthcare domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Gujarati language spoken in India.


Speech Data:

This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the Healthcare domain, to build robust and accurate customer service speech technology.


To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Gujarati speakers from different part of Gujarat. This collaborative effort ensures a balanced representation of Indian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.


Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.


The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.


Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.


The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Gujarati language call center speech recognition models for the Healthcare domain.


Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.


These ready-to-use transcriptions accelerate the development of Healthcare call center conversational AI and ASR models for the Gujarati language.


Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.


If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.


License:

This Healthcare call center audio dataset is created by FutureBeeAI and is available for commercial use!


Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Healthcare sector, our dataset serves as a trusted resource to meet your goals


Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Male(30)Male(26)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.5251.075Speaker 1<lang:Foreign>Hello</lang:Foreign>
Speech1.8004.424Speaker 2<lang:Foreign>Hello featurebee</lang:Foreign> #અર
Speech5.4748.975Speaker 1હા હું <lang:Foreign>feature b hospital</lang:Foreign>થી બોલું છું. <lang:Foreign>customer representative</lang:Foreign>
Speech9.45113.948Speaker 1<lang:Foreign>sir</lang:Foreign> તમે એક <lang:Foreign>Query</lang:Foreign>નોધાવી હતી અમારા <lang:Foreign>website</lang:Foreign>પર એટલે તમને <lang:Foreign>Call</lang:Foreign>કરવા માં આવે છે.
Speech14.24817.148Speaker 1તમે મને જણાવી શકો કે તમારે શું જાણવું હતું?
Speech19.12230.371Speaker 2હા<lang:Foreign>sir</lang:Foreign> મારે <lang:Foreign>Actually covid vaccine</lang:Foreign>ની થોડી ગણી માહિતી જોઈતી હતી. <lang:Foreign>Because</lang:Foreign> #અર અત્યારે મેં મારા <lang:Foreign>family</lang:Foreign> બે <lang:Foreign>dose</lang:Foreign>લીધા છે. <lang:Foreign>vaccine</lang:Foreign>ના
Speech25.59726.122Speaker 1અચ્છા
Speech31.07132.021Speaker 1હા હા
Speech31.92135.395Speaker 2તો એની આગળ શું કેવી રીતે ધ્યાન રાખવા નું એ થોડુક કહેશો અમને
Speech37.07640.350Speaker 1અચ્છા અચ્છા હા તો અત્યારે આજકાલ છે ને #આહ
Speech41.17543.175Speaker 1<lang:Foreign>covid</lang:Foreign> ની <lang:Foreign>wave</lang:Foreign> ચાલુ થાય છે.
Speech43.65046.574Speaker 1એટલે જરૂરી છે કે તમે <lang:Foreign>vaccine</lang:Foreign> લો આની અને
Speech46.95054.098Speaker 1એ આજ કાલ કેવું છે. <lang:Foreign>market</lang:Foreign> છે ને <lang:Foreign>wave</lang:Foreign> પાછી આવે છે. એટલે <lang:Foreign>covid</lang:Foreign> નો <lang:Foreign>booster dose</lang:Foreign> બધાએ કરાવી જ લેવું જોઈએ.
Speech55.64856.499Speaker 1તો એનામાં
Speech56.90061.872Speaker 1હા તમે પહેલા <lang:Foreign>vaccine</lang:Foreign> લીધી હશે તો તમે તમારા <lang:Foreign>family</lang:Foreign> વાળા એ બંને <lang:Foreign>dose</lang:Foreign> પુરા કર્યા હશે.
Speech57.59858.223Speaker 2<lang:Foreign>ok</lang:Foreign>
Speech63.00367.827Speaker 2હા અમારા અમારા પાંચ <lang:Foreign>member</lang:Foreign>છે. ઘરમાં બધાના બે બે <lang:Foreign>dose</lang:Foreign> તો થઇ ગયા છે.
Speech68.00270.499Speaker 2એમને કેટલા ત્રણ ચાર મહિના થઇ ગયા એમને લઈને
Speech68.42469.024Speaker 1આચ્છા
Speech71.57476.423Speaker 1અચ્છા કયા <lang:Foreign>dose</lang:Foreign>લીધા તા તમે <lang:Foreign>Covaxin covishield</lang:Foreign> કે બીજું કાઈ
Speech78.57381.247Speaker 2<lang:Foreign>most of</lang:Foreign> બધા ના તો અમારા <lang:Foreign>covishield</lang:Foreign>ના જ હતા.
Speech82.37285.308Speaker 1અચ્છા અને બેઉ <lang:Foreign>dose</lang:Foreign> બધા ના પુરા જ થઇ ગયા હતા.
Speech83.80885.758Speaker 2#હમ
Speech85.80895.807Speaker 1અચ્છા હા તો તમે <lang:Foreign>covishield</lang:Foreign> બેઉ <lang:Foreign>dose</lang:Foreign>પુરા કર્યા છે તો તમારે હવે ત્રીજો <lang:Foreign>booster dose</lang:Foreign>લેવા નો છે. ને હું જાની શકું કે ક્યારે અમે પુરા કર્યા છે આ બૅઉ <lang:Foreign>dose</lang:Foreign> એક વર્ષ થાયી ગયો છે આ બન્નેઓને
Speech98.381107.661Speaker 2મને તો થઇ ગયો છે. મને અને મારા <lang:Foreign>father</lang:Foreign> ને પણ મારી <lang:Foreign>wife</lang:Foreign> અને મમ્મી ના હજુ ચાર કે પાંચ મહિના થયા છે. બે <lang:Foreign>dose</lang:Foreign>પતિ ને
Speech109.035115.385Speaker 1અચ્છા અચ્છા તો એમાં <lang:Foreign>sir</lang:Foreign> વાત એવી છે કે એક વર્ષ પતેને તો જ તમારે <lang:Foreign>booster dose</lang:Foreign> લઇ શકો.
Speech115.385116.834Speaker 2<lang:Foreign>dose</lang:Foreign> લેવાય <lang:Foreign>ok</lang:Foreign>
Speech116.359123.908Speaker 1હા એટલે હમણા હું <lang:Foreign>suggest</lang:Foreign> નહિ કરીશ કે તમારા <lang:Foreign>wife</lang:Foreign> કે તમારા મમ્મી પછી કરવડાવો <lang:Foreign>but</lang:Foreign> તમે છે ને તમે અને તમારા <lang:Foreign>father</lang:Foreign> પહેલા કરાવીદોં.
Speech124.483132.498Speaker 1તો એ તો <lang:Foreign>process</lang:Foreign> તો <lang:Foreign>sir</lang:Foreign> એમાં છે ને એટલે તમે ગયા વખત કરાયું <lang:Foreign>last time</lang:Foreign> હતું એવું જ છે. એટલે એમાં કોઈ <lang:Foreign>change</lang:Foreign>નથી.
Speech126.683127.183Speaker 2#અર
Speech133.049134.851Speaker 1<lang:Foreign>but</lang:Foreign> તમારે શું જાણવું હતું
Speech134.426139.426Speaker 2અચ્છા એની પણ એની પણ <lang:Foreign>same appointment</lang:Foreign> લઇ ને <lang:Foreign>slot book</lang:Foreign> કરાવીએ એવું છે કે
Noise135.351138.076--
Speech139.326149.649Speaker 1હા હા એ તમારે એ જે તમે આરોગ્ય શેતુ <lang:Foreign>app</lang:Foreign> ઉપર કરતાં હતા ને પહેલા જ <lang:Foreign>appointment</lang:Foreign> જોતા હતા. તમે પેલા ત્યાં એટલે કાતો એકવાર તમે <lang:Foreign>app</lang:Foreign> ખોલો એટલે હું તમને હમણાજ તમને ફટાફટ <lang:Foreign>guide</lang:Foreign> કરી દઈ તમને.
Speech145.075145.725Speaker 2#અર
Speech151.038151.748Speaker 1એવું હોય તો
Speech152.163152.798Speaker 2અચ્છા
Speech152.899153.413Speaker 1હા
Speech153.274163.012Speaker 2નહિ એ <lang:Foreign>procees</lang:Foreign> તો મને ખબર છે. એટલે <lang:Foreign>sem</lang:Foreign> પોત પોતાના બે <lang:Foreign>slot</lang:Foreign> હવે મારા ને મારા <lang:Foreign>father</lang:Foreign> ના બે <lang:Foreign>slot book</lang:Foreign> કરાવી દઈસ હું. અમારા નજીક ના <lang:Foreign>center</lang:Foreign>માં
Speech164.111166.211Speaker 2એ તો ખબર છે મને <lang:Foreign>process</lang:Foreign>
Speech165.561166.220Speaker 1હા
Speech167.446168.817Speaker 1અચ્છા હા
Speech167.561172.210Speaker 2એ <lang:Foreign>appoimennt</lang:Foreign> લઇ ને <lang:Foreign>boosterdose</lang:Foreign>લઇ આવવા નો બસ એટલું જ છે એમાં
Noise168.818170.760--
Speech172.910183.023Speaker 1હા હા એમાં એટલું જ છે એમાં કઈ વધારે જાજુ નથી. તમે એક કામ કરો ને તમે મન ખાલી એટલું કોને હું ફટાફટ એ <lang:Foreign>chek</lang:Foreign> કરી લઉં કે <lang:Foreign>slot</lang:Foreign>માં છે કે નય <lang:Foreign>booseter dose</lang:Foreign> તમારા <lang:Foreign>area</lang:Foreign> માં તમે ક્યાં રહો છો સુરતમાં?

TRANSCRIPTION

TIMETRANSCRIPT
0.525
1.075
<lang:Foreign>Hello</lang:Foreign>
1.800
4.424
<lang:Foreign>Hello featurebee</lang:Foreign> #અર
5.474
8.975
હા હું <lang:Foreign>feature b hospital</lang:Foreign>થી બોલું છું. <lang:Foreign>customer representative</lang:Foreign>
9.451
13.948
<lang:Foreign>sir</lang:Foreign> તમે એક <lang:Foreign>Query</lang:Foreign>નોધાવી હતી અમારા <lang:Foreign>website</lang:Foreign>પર એટલે તમને <lang:Foreign>Call</lang:Foreign>કરવા માં આવે છે.
14.248
17.148
તમે મને જણાવી શકો કે તમારે શું જાણવું હતું?
19.122
30.371
હા<lang:Foreign>sir</lang:Foreign> મારે <lang:Foreign>Actually covid vaccine</lang:Foreign>ની થોડી ગણી માહિતી જોઈતી હતી. <lang:Foreign>Because</lang:Foreign> #અર અત્યારે મેં મારા <lang:Foreign>family</lang:Foreign> બે <lang:Foreign>dose</lang:Foreign>લીધા છે. <lang:Foreign>vaccine</lang:Foreign>ના
25.597
26.122
અચ્છા
31.071
32.021
હા હા
31.921
35.395
તો એની આગળ શું કેવી રીતે ધ્યાન રાખવા નું એ થોડુક કહેશો અમને
37.076
40.350
અચ્છા અચ્છા હા તો અત્યારે આજકાલ છે ને #આહ
41.175
43.175
<lang:Foreign>covid</lang:Foreign> ની <lang:Foreign>wave</lang:Foreign> ચાલુ થાય છે.
43.650
46.574
એટલે જરૂરી છે કે તમે <lang:Foreign>vaccine</lang:Foreign> લો આની અને
46.950
54.098
એ આજ કાલ કેવું છે. <lang:Foreign>market</lang:Foreign> છે ને <lang:Foreign>wave</lang:Foreign> પાછી આવે છે. એટલે <lang:Foreign>covid</lang:Foreign> નો <lang:Foreign>booster dose</lang:Foreign> બધાએ કરાવી જ લેવું જોઈએ.
55.648
56.499
તો એનામાં
56.900
61.872
હા તમે પહેલા <lang:Foreign>vaccine</lang:Foreign> લીધી હશે તો તમે તમારા <lang:Foreign>family</lang:Foreign> વાળા એ બંને <lang:Foreign>dose</lang:Foreign> પુરા કર્યા હશે.
57.598
58.223
<lang:Foreign>ok</lang:Foreign>
63.003
67.827
હા અમારા અમારા પાંચ <lang:Foreign>member</lang:Foreign>છે. ઘરમાં બધાના બે બે <lang:Foreign>dose</lang:Foreign> તો થઇ ગયા છે.
68.002
70.499
એમને કેટલા ત્રણ ચાર મહિના થઇ ગયા એમને લઈને
68.424
69.024
આચ્છા
71.574
76.423
અચ્છા કયા <lang:Foreign>dose</lang:Foreign>લીધા તા તમે <lang:Foreign>Covaxin covishield</lang:Foreign> કે બીજું કાઈ
78.573
81.247
<lang:Foreign>most of</lang:Foreign> બધા ના તો અમારા <lang:Foreign>covishield</lang:Foreign>ના જ હતા.
82.372
85.308
અચ્છા અને બેઉ <lang:Foreign>dose</lang:Foreign> બધા ના પુરા જ થઇ ગયા હતા.
83.808
85.758
#હમ
85.808
95.807
અચ્છા હા તો તમે <lang:Foreign>covishield</lang:Foreign> બેઉ <lang:Foreign>dose</lang:Foreign>પુરા કર્યા છે તો તમારે હવે ત્રીજો <lang:Foreign>booster dose</lang:Foreign>લેવા નો છે. ને હું જાની શકું કે ક્યારે અમે પુરા કર્યા છે આ બૅઉ <lang:Foreign>dose</lang:Foreign> એક વર્ષ થાયી ગયો છે આ બન્નેઓને
98.381
107.661
મને તો થઇ ગયો છે. મને અને મારા <lang:Foreign>father</lang:Foreign> ને પણ મારી <lang:Foreign>wife</lang:Foreign> અને મમ્મી ના હજુ ચાર કે પાંચ મહિના થયા છે. બે <lang:Foreign>dose</lang:Foreign>પતિ ને
109.035
115.385
અચ્છા અચ્છા તો એમાં <lang:Foreign>sir</lang:Foreign> વાત એવી છે કે એક વર્ષ પતેને તો જ તમારે <lang:Foreign>booster dose</lang:Foreign> લઇ શકો.
115.385
116.834
<lang:Foreign>dose</lang:Foreign> લેવાય <lang:Foreign>ok</lang:Foreign>
116.359
123.908
હા એટલે હમણા હું <lang:Foreign>suggest</lang:Foreign> નહિ કરીશ કે તમારા <lang:Foreign>wife</lang:Foreign> કે તમારા મમ્મી પછી કરવડાવો <lang:Foreign>but</lang:Foreign> તમે છે ને તમે અને તમારા <lang:Foreign>father</lang:Foreign> પહેલા કરાવીદોં.
124.483
132.498
તો એ તો <lang:Foreign>process</lang:Foreign> તો <lang:Foreign>sir</lang:Foreign> એમાં છે ને એટલે તમે ગયા વખત કરાયું <lang:Foreign>last time</lang:Foreign> હતું એવું જ છે. એટલે એમાં કોઈ <lang:Foreign>change</lang:Foreign>નથી.
126.683
127.183
#અર
133.049
134.851
<lang:Foreign>but</lang:Foreign> તમારે શું જાણવું હતું
134.426
139.426
અચ્છા એની પણ એની પણ <lang:Foreign>same appointment</lang:Foreign> લઇ ને <lang:Foreign>slot book</lang:Foreign> કરાવીએ એવું છે કે
135.351
138.076
-
139.326
149.649
હા હા એ તમારે એ જે તમે આરોગ્ય શેતુ <lang:Foreign>app</lang:Foreign> ઉપર કરતાં હતા ને પહેલા જ <lang:Foreign>appointment</lang:Foreign> જોતા હતા. તમે પેલા ત્યાં એટલે કાતો એકવાર તમે <lang:Foreign>app</lang:Foreign> ખોલો એટલે હું તમને હમણાજ તમને ફટાફટ <lang:Foreign>guide</lang:Foreign> કરી દઈ તમને.
145.075
145.725
#અર
151.038
151.748
એવું હોય તો
152.163
152.798
અચ્છા
152.899
153.413
હા
153.274
163.012
નહિ એ <lang:Foreign>procees</lang:Foreign> તો મને ખબર છે. એટલે <lang:Foreign>sem</lang:Foreign> પોત પોતાના બે <lang:Foreign>slot</lang:Foreign> હવે મારા ને મારા <lang:Foreign>father</lang:Foreign> ના બે <lang:Foreign>slot book</lang:Foreign> કરાવી દઈસ હું. અમારા નજીક ના <lang:Foreign>center</lang:Foreign>માં
164.111
166.211
એ તો ખબર છે મને <lang:Foreign>process</lang:Foreign>
165.561
166.220
હા
167.446
168.817
અચ્છા હા
167.561
172.210
એ <lang:Foreign>appoimennt</lang:Foreign> લઇ ને <lang:Foreign>boosterdose</lang:Foreign>લઇ આવવા નો બસ એટલું જ છે એમાં
168.818
170.760
-
172.910
183.023
હા હા એમાં એટલું જ છે એમાં કઈ વધારે જાજુ નથી. તમે એક કામ કરો ને તમે મન ખાલી એટલું કોને હું ફટાફટ એ <lang:Foreign>chek</lang:Foreign> કરી લઉં કે <lang:Foreign>slot</lang:Foreign>માં છે કે નય <lang:Foreign>booseter dose</lang:Foreign> તમારા <lang:Foreign>area</lang:Foreign> માં તમે ક્યાં રહો છો સુરતમાં?

Dataset Demographics

Details Headline

Language

Gujarati

Language code

gu-in

Country

India

Accents

Kathiawari,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg