Spanish (Spain) Call Center Speech Dataset for BFSI

The audio dataset includes call center conversations in BFSI, featuring native Spanish speakers from Spain, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

July 2023

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Spanish Language Call Center Speech Dataset for the BFSI domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the BFSI industry.


With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the BFSI domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Spanish language spoken in Spain.


Speech Data:

This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the BFSI domain, to build robust and accurate customer service speech technology.


To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Spanish speakers from different states/provinces of Spain. This collaborative effort ensures a balanced representation of Spain accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.


Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.


The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.


Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.


The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Spanish language call center speech recognition models for the BFSI domain.


Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.


These ready-to-use transcriptions accelerate the development of BFSI call center conversational AI and ASR models for the Spanish language.


Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.


If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.


License:

This BFSI call center audio dataset is created by FutureBeeAI and is available for commercial use!


Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the BFSI sector, our dataset serves as a trusted resource to meet your goals


Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Female(46)Female(40)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.7101.808Speaker 2Hey Futurebee
Speech3.7936.735Speaker 1Banco Mediterráneo, buenos días. ¿En qué puedo ayudarle?
Speech7.31511.442Speaker 2Buenos días, me gustaría informarme de las cuentas que tienen.
Speech12.20114.390Speaker 1Claro que sí. ¿Es usted cliente nuestro?
Speech15.08915.682Speaker 2No.
Speech16.41922.280Speaker 1Ah, pues le informo. Verá, tiene dos tipos de cuentas, las cuentas de ahorro y las cuentas corrientes.
Speech22.85229.414Speaker 1Las cuentas de ahorro son aquellas cuentas en las que usted ingresa una cantidad de dinero con intención de
Noise25.53925.728--
Noise26.32726.695--
Speech29.95130.803Speaker 1dejarla ahí
Noise31.10931.396--
Speech31.27434.701Speaker 1y eso le va a generar una serie de intereses a final de mes.
Noise31.99532.554--
Speech35.10946.655Speaker 1Y las cuentas corrientes sirven para que usted [filler] disponga de su dinero inmediatamente, ya sea mediante cheque, talón o cualquier otro método de pago. ¿En qué estaría usted interesado?
Noise39.72540.094--
Speech47.25848.655Speaker 2En una cuenta corriente.
Speech49.17350.219Speaker 1Ah, fenomenal.
Speech50.85954.496Speaker 1Y dígame, ¿asociaría a esta cuenta u~ una tarjeta?
Noise51.95352.264--
Speech55.90257.097Speaker 2[filler]Sí.
Speech57.65460.051Speaker 1Y qué sería, ¿una tarjeta de crédito o de débito?
Speech61.32062.728Speaker 2[filler]Eso no lo sé.
Noise63.12563.682--
Speech64.20065.337Speaker 2¿Cuál es la difirencia?
Noise64.36764.733--
Speech66.08781.031Speaker 1Verá, una tarjeta [filler] de crédito es una tarjeta que le proporciona el banco y que le da acceso a un crédito, donde usted podrá hacer uso de él durante todo el mes, y al final del mes deberá pa~ deberá abonar, eso, la cantidad que usted haya utilizado.
Speech81.55185.763Speaker 1[filler]Y todo eso por un tanto por ciento que le cobrará el banco.
Speech86.52287.010Speaker 2[filler]
Speech87.41893.896Speaker 1Una pequeña comisión. Y su cuenta de débito, usted solamente dispondrá del dinero que usted tenga en su cuenta.
Speech96.34098.266Speaker 2De acuerdo. Una tarjeta de débito.
Speech98.76099.927Speaker 1Ah, pues fenomenal.
Speech100.852105.075Speaker 1Si quiere, le puedo mandar la documentación a su correo electrónico
Speech105.703110.587Speaker 1y usted, en cualquier momento se paso por c~ cualquiera de nuestras oficinas y formaliza el contrato.
Noise111.131111.498--
Speech112.078112.896Speaker 2De acuerdo.
Noise113.126113.459--
Speech114.912118.453Speaker 1Y, dígame. ¿Me podría [filler] me podría facilitar su correo electrónico?
Speech118.878121.706Speaker 2Por supuesto. <PII>Manuela García</PII> arroba
Speech122.474123.539Speaker 2Gmail punto com.
Speech124.022125.378Speaker 1Muy bien. Un segundo.
Speech126.947136.354Speaker 1Pues, le acabo de mandar toda la información. Si usted quiere, mañana se pasa por cualquiera de nuestras oficinas y nosotros le tramitamos el alta tanto de la tarjeta como de la cuenta.
Speech137.085140.913Speaker 2De acuerdo. Pero antes de hacerme la cuenta, tengo algunas preguntas.
Speech141.497142.711Speaker 1Sí, claro. Dígame.
Noise142.407142.669--
Speech143.187149.657Speaker 2Me gustaría saber [filler] si tendría acceso con esa cuenta a mi cuenta de Paypal
Speech151.298151.979Speaker 1Sí, claro.
Speech151.497151.953Speaker 2y
Noise152.479152.763--
Speech152.614153.032Speaker 2¿Sí?
Speech153.620158.792Speaker 1A ver, le explico. Nosotros tenemos una aplicación, una Ap~ una App
Speech159.292174.252Speaker 1en la que usted podrá ingresar con su <initial>DNI</initial> y con la clave que le facilitemos y usted, desde ahí, podrá acceder tanto a su cuenta de Paypal como si quiere reali~ quiere crear una tarjeta virtual con la comprar por internet. Es muy sencillo y bastante intuitivo.
Speech175.050176.786Speaker 2¿Tengo acceso a Bizum también?
Speech177.824187.286Speaker 1Sí, claro. Eso, y además es superfácil. Si tiene algún problema usted solamente tiene que llamarnos aquí a atención al cliente y yo le explico exactamente lo que tiene que hacer

TRANSCRIPTION

TIMETRANSCRIPT
0.710
1.808
Hey Futurebee
3.793
6.735
Banco Mediterráneo, buenos días. ¿En qué puedo ayudarle?
7.315
11.442
Buenos días, me gustaría informarme de las cuentas que tienen.
12.201
14.390
Claro que sí. ¿Es usted cliente nuestro?
15.089
15.682
No.
16.419
22.280
Ah, pues le informo. Verá, tiene dos tipos de cuentas, las cuentas de ahorro y las cuentas corrientes.
22.852
29.414
Las cuentas de ahorro son aquellas cuentas en las que usted ingresa una cantidad de dinero con intención de
25.539
25.728
-
26.327
26.695
-
29.951
30.803
dejarla ahí
31.109
31.396
-
31.274
34.701
y eso le va a generar una serie de intereses a final de mes.
31.995
32.554
-
35.109
46.655
Y las cuentas corrientes sirven para que usted [filler] disponga de su dinero inmediatamente, ya sea mediante cheque, talón o cualquier otro método de pago. ¿En qué estaría usted interesado?
39.725
40.094
-
47.258
48.655
En una cuenta corriente.
49.173
50.219
Ah, fenomenal.
50.859
54.496
Y dígame, ¿asociaría a esta cuenta u~ una tarjeta?
51.953
52.264
-
55.902
57.097
[filler]Sí.
57.654
60.051
Y qué sería, ¿una tarjeta de crédito o de débito?
61.320
62.728
[filler]Eso no lo sé.
63.125
63.682
-
64.200
65.337
¿Cuál es la difirencia?
64.367
64.733
-
66.087
81.031
Verá, una tarjeta [filler] de crédito es una tarjeta que le proporciona el banco y que le da acceso a un crédito, donde usted podrá hacer uso de él durante todo el mes, y al final del mes deberá pa~ deberá abonar, eso, la cantidad que usted haya utilizado.
81.551
85.763
[filler]Y todo eso por un tanto por ciento que le cobrará el banco.
86.522
87.010
[filler]
87.418
93.896
Una pequeña comisión. Y su cuenta de débito, usted solamente dispondrá del dinero que usted tenga en su cuenta.
96.340
98.266
De acuerdo. Una tarjeta de débito.
98.760
99.927
Ah, pues fenomenal.
100.852
105.075
Si quiere, le puedo mandar la documentación a su correo electrónico
105.703
110.587
y usted, en cualquier momento se paso por c~ cualquiera de nuestras oficinas y formaliza el contrato.
111.131
111.498
-
112.078
112.896
De acuerdo.
113.126
113.459
-
114.912
118.453
Y, dígame. ¿Me podría [filler] me podría facilitar su correo electrónico?
118.878
121.706
Por supuesto. <PII>Manuela García</PII> arroba
122.474
123.539
Gmail punto com.
124.022
125.378
Muy bien. Un segundo.
126.947
136.354
Pues, le acabo de mandar toda la información. Si usted quiere, mañana se pasa por cualquiera de nuestras oficinas y nosotros le tramitamos el alta tanto de la tarjeta como de la cuenta.
137.085
140.913
De acuerdo. Pero antes de hacerme la cuenta, tengo algunas preguntas.
141.497
142.711
Sí, claro. Dígame.
142.407
142.669
-
143.187
149.657
Me gustaría saber [filler] si tendría acceso con esa cuenta a mi cuenta de Paypal
151.298
151.979
Sí, claro.
151.497
151.953
y
152.479
152.763
-
152.614
153.032
¿Sí?
153.620
158.792
A ver, le explico. Nosotros tenemos una aplicación, una Ap~ una App
159.292
174.252
en la que usted podrá ingresar con su <initial>DNI</initial> y con la clave que le facilitemos y usted, desde ahí, podrá acceder tanto a su cuenta de Paypal como si quiere reali~ quiere crear una tarjeta virtual con la comprar por internet. Es muy sencillo y bastante intuitivo.
175.050
176.786
¿Tengo acceso a Bizum también?
177.824
187.286
Sí, claro. Eso, y además es superfácil. Si tiene algún problema usted solamente tiene que llamarnos aquí a atención al cliente y yo le explico exactamente lo que tiene que hacer

Dataset Demographics

Details Headline

Language

Spanish

Language code

es

Country

Spain

Accents

Castellano del Norte,...more

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg