Spanish (Spain) Call Center Speech Dataset for Telecom

The audio dataset includes call center conversations in Telecom, featuring native Spanish speakers from Spain, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

July 2023

Number of participants

60

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Spanish Language Call Center Speech Dataset for the Telecom domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the Telecom industry.


With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the Telecom domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Spanish language spoken in Spain.


Speech Data:

This training dataset comprises 30 hours of call center audio recordings covering various topics and scenarios related to the Telecom domain, to build robust and accurate customer service speech technology.


To curate realistic call center interactions, we collaborated with a diverse network of 60 expert native Spanish speakers from different states/provinces of Spain. This collaborative effort ensures a balanced representation of Spain accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.


Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.


The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.


Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.


The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Spanish language call center speech recognition models for the Telecom domain.


Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.


These ready-to-use transcriptions accelerate the development of Telecom call center conversational AI and ASR models for the Spanish language.


Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.


If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.


License:

This Telecom call center audio dataset is created by FutureBeeAI and is available for commercial use!


Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the Telecom sector, our dataset serves as a trusted resource to meet your goals


Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Female(46)Female(40)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.0001.173Speaker 2<lang:Foreign>Hey FutureBee</lang:Foreign>
Speech2.0483.149Speaker 2Buenos días.
Speech4.7997.323Speaker 1Blaveo, buenos días. ¿En qué puedo ayudarte?
Speech6.69813.573Speaker 2Hola, buenos días. [filler] Llamaba para informarme sobre las tarifas de de teléfono móviles que tienen.
Speech15.07320.774Speaker 1Claro que sí. Y dígame, ¿qué se trataría de una línea de prepago o una línea de contrato?
Speech20.87322.474Speaker 2Una línea de contrato.
Speech24.02428.748Speaker 1¿Y qué es? ¿Una portabilidad, es una migración o es una línea nueva?
Speech28.67332.899Speaker 2[filler]No sé la diferencia entre portabilidad y migración.
Speech34.19835.948Speaker 1No se preocupe que yo se lo explico.
Speech36.57342.173Speaker 1Verá, una portabilidad es cuando usted está en otro operador y se viene con nosotros a nuestra compañía.
Speech42.79848.374Speaker 1Y una migración es cuando usted tiene una tarjeta de prepago de nuestra compañía y la pasa a contrato.
Speech48.27449.874Speaker 2Ah, es una portabilidad.
Speech51.07352.148Speaker 1Ah, muy bien.
Speech52.57361.347Speaker 1Y dígame, ¿qué uso hace usted de su móvil? No sé, ¿utiliza mucho las llamadas de teléfono?, ¿utiliza mucho internet? No sé, dígame.
Speech60.87162.948Speaker 2Pues lo uso mucho todo, la verdad.
Speech64.29867.147Speaker 1¿Sí? Verá, es que tenemos [filler] varias tarifas.
Speech67.52269.572Speaker 1¿Qué va a ser, sólo una línea o van a ser varias?
Speech70.47172.498Speaker 2Ahora mismo, sólo la mía.
Speech73.44774.221Speaker 1Ajá.
Speech74.57280.096Speaker 1Verá, yo si quiere, le puedo decir nuestras tarifas de móvil y usted me dice cuál se adecúa más a usted.
Speech79.87380.873Speaker 2De acuerdo.
Speech82.42388.596Speaker 1Verá, la primera tarifa, no [noise] creo... Si usted dice que utiliza mucho el móvil y [noise]
Speech88.92391.846Speaker 1y el internet, no sé si le sería muy conveniente.
Speech92.32295.471Speaker 1Es una tarifa que cuesta cuatro con noventa euros al mes.
Speech96.048103.572Speaker 1Y esa tarifa incluye ciento cincuenta minutos totalmente gratis al mes para (()) para hablar y cien megas de internet.
Speech104.245105.822Speaker 2[filler]Ese es muy poco.
Speech106.822107.647Speaker 1Sí, ¿verdad?
Speech107.022108.397Speaker 2Y necesito gigas.
Speech109.310111.858Speaker 1Claro, a ver. Tenemos una segunda
Speech112.171116.197Speaker 1que sería, tendría un coste de seis con noventa euros al mes
Speech116.971119.971Speaker 1y le incluiría llamadas ilimitadas
Speech120.447124.822Speaker 1a todos los móviles y fijos, a excepción de los números excepcionales
Speech125.397126.947Speaker 1y cinco gigas de internet.
Speech127.096127.697Speaker 2Ajá.
Speech129.419130.770Speaker 1¿Esa le iría mejor?
Speech130.294131.794Speaker 2Sí, sí.
Speech132.294132.747Speaker 2Au~
Speech132.847139.197Speaker 1De todas maneras, le voy a decir otras que son tienen un poco más de internet por si acaso le cuadrasen un poco más.
Speech138.725138.975Speaker 2Sí.
Speech140.145144.347Speaker 1Tenemos una, la tercera tarifa, por nueve con noventa euros al mes
Speech144.972147.597Speaker 1y incluirían diez gigas de internet
Speech147.997151.471Speaker 1y todas las llamadas ilimitadas durante.
Speech151.096152.443Speaker 2Esta me interesa más.
Speech154.359156.883Speaker 1Hay otra que es un poco más alta que sería
Speech157.334163.109Speaker 1veinte gigas de internet más llamadas ilimitadas por doce con noventa euros al mes.
Speech164.246169.020Speaker 2[filler]Una pregunta. ¿Tenéis alguna tarifa que tenga gigas ilimitados?
Speech166.834167.633Speaker 1Dígame.
Speech170.746175.596Speaker 1No, lo que pasa que tenemos tarifas que tienen muchísimos gigas que es como si fuera ilimitado.
Speech175.145175.794Speaker 2Ajá.
Speech176.020177.846Speaker 1Por que tenemos una tarifa
Speech178.246186.895Speaker 1que son catorce con noventa euros al mes, pero tiene cincuenta gigas al mes, que son muchos gigas y tiene todas las llamadas ilimitadas.

TRANSCRIPTION

TIMETRANSCRIPT
0.000
1.173
<lang:Foreign>Hey FutureBee</lang:Foreign>
2.048
3.149
Buenos días.
4.799
7.323
Blaveo, buenos días. ¿En qué puedo ayudarte?
6.698
13.573
Hola, buenos días. [filler] Llamaba para informarme sobre las tarifas de de teléfono móviles que tienen.
15.073
20.774
Claro que sí. Y dígame, ¿qué se trataría de una línea de prepago o una línea de contrato?
20.873
22.474
Una línea de contrato.
24.024
28.748
¿Y qué es? ¿Una portabilidad, es una migración o es una línea nueva?
28.673
32.899
[filler]No sé la diferencia entre portabilidad y migración.
34.198
35.948
No se preocupe que yo se lo explico.
36.573
42.173
Verá, una portabilidad es cuando usted está en otro operador y se viene con nosotros a nuestra compañía.
42.798
48.374
Y una migración es cuando usted tiene una tarjeta de prepago de nuestra compañía y la pasa a contrato.
48.274
49.874
Ah, es una portabilidad.
51.073
52.148
Ah, muy bien.
52.573
61.347
Y dígame, ¿qué uso hace usted de su móvil? No sé, ¿utiliza mucho las llamadas de teléfono?, ¿utiliza mucho internet? No sé, dígame.
60.871
62.948
Pues lo uso mucho todo, la verdad.
64.298
67.147
¿Sí? Verá, es que tenemos [filler] varias tarifas.
67.522
69.572
¿Qué va a ser, sólo una línea o van a ser varias?
70.471
72.498
Ahora mismo, sólo la mía.
73.447
74.221
Ajá.
74.572
80.096
Verá, yo si quiere, le puedo decir nuestras tarifas de móvil y usted me dice cuál se adecúa más a usted.
79.873
80.873
De acuerdo.
82.423
88.596
Verá, la primera tarifa, no [noise] creo... Si usted dice que utiliza mucho el móvil y [noise]
88.923
91.846
y el internet, no sé si le sería muy conveniente.
92.322
95.471
Es una tarifa que cuesta cuatro con noventa euros al mes.
96.048
103.572
Y esa tarifa incluye ciento cincuenta minutos totalmente gratis al mes para (()) para hablar y cien megas de internet.
104.245
105.822
[filler]Ese es muy poco.
106.822
107.647
Sí, ¿verdad?
107.022
108.397
Y necesito gigas.
109.310
111.858
Claro, a ver. Tenemos una segunda
112.171
116.197
que sería, tendría un coste de seis con noventa euros al mes
116.971
119.971
y le incluiría llamadas ilimitadas
120.447
124.822
a todos los móviles y fijos, a excepción de los números excepcionales
125.397
126.947
y cinco gigas de internet.
127.096
127.697
Ajá.
129.419
130.770
¿Esa le iría mejor?
130.294
131.794
Sí, sí.
132.294
132.747
Au~
132.847
139.197
De todas maneras, le voy a decir otras que son tienen un poco más de internet por si acaso le cuadrasen un poco más.
138.725
138.975
Sí.
140.145
144.347
Tenemos una, la tercera tarifa, por nueve con noventa euros al mes
144.972
147.597
y incluirían diez gigas de internet
147.997
151.471
y todas las llamadas ilimitadas durante.
151.096
152.443
Esta me interesa más.
154.359
156.883
Hay otra que es un poco más alta que sería
157.334
163.109
veinte gigas de internet más llamadas ilimitadas por doce con noventa euros al mes.
164.246
169.020
[filler]Una pregunta. ¿Tenéis alguna tarifa que tenga gigas ilimitados?
166.834
167.633
Dígame.
170.746
175.596
No, lo que pasa que tenemos tarifas que tienen muchísimos gigas que es como si fuera ilimitado.
175.145
175.794
Ajá.
176.020
177.846
Por que tenemos una tarifa
178.246
186.895
que son catorce con noventa euros al mes, pero tiene cincuenta gigas al mes, que son muchos gigas y tiene todas las llamadas ilimitadas.

Dataset Demographics

Details Headline

Language

Spanish

Language code

es

Country

Spain

Accents

Castellano del Norte,...more

Gender Distribution

M: 55, F: 45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg