Italian Call Center Speech Dataset for BFSI

This Italian speech dataset features real-world call center conversations from the BFSI domain. With detailed metadata and accurate transcriptions, it’s designed to power ASR systems, voice AI, and conversational agents.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

June 2025

Number of participants

60

AI audio dataset for BFSI in Italian (Italy)
Download
Download Icon

About this Off-the-shelf Speech Dataset

Card Head Line

Introduction

This Italian Call Center Speech Dataset for the BFSI (Banking, Financial Services, and Insurance) sector is purpose-built to accelerate the development of speech recognition, spoken language understanding, and conversational AI systems tailored for Italian-speaking customers. Featuring over 30 hours of real-world, unscripted audio, it offers authentic customer-agent interactions across a range of BFSI services to train robust and domain-aware ASR models.

Curated by FutureBeeAI, this dataset empowers voice AI developers, financial technology teams, and NLP researchers to build high-accuracy, production-ready models across BFSI customer service scenarios.

Speech Data

The dataset contains 30 hours of dual-channel call center recordings between native Italian speakers. Captured in realistic financial support settings, these conversations span diverse BFSI topics from loan enquiries and card disputes to insurance claims and investment options, providing deep contextual coverage for model training and evaluation.

  • Participant Diversity:
  • Speakers: 60 native Italian speakers from our verified contributor pool.
  • Regions: Representing multiple provinces across Italy to ensure coverage of various accents and dialects.
  • Participant Profile: Balanced gender mix (60% male, 40% female) with age distribution from 18 to 70 years.
  • Recording Details:
  • Conversation Nature: Naturally flowing, unscripted interactions between agents and customers.
  • Call Duration: Ranges from 5 to 15 minutes.
  • Audio Format: Stereo WAV files, 16-bit depth, at 8kHz and 16kHz sample rates.
  • Recording Environment: Captured in clean conditions with no echo or background noise.
  • Topic Diversity

    This speech corpus includes both inbound and outbound calls with varied conversational outcomes like positive, negative, and neutral, ensuring real-world BFSI voice coverage.

  • Inbound Calls:
  • Debit Card Block Request
  • Transaction Disputes
  • Loan Enquiries
  • Credit Card Billing Issues
  • Account Closure & Claims
  • Policy Renewals & Cancellations
  • Retirement & Tax Planning
  • Investment Risk Queries, and more
  • Outbound Calls:
  • Loan & Credit Card Offers
  • Customer Surveys
  • EMI Reminders
  • Policy Upgrades
  • Insurance Follow-ups
  • Investment Opportunity Calls
  • Retirement Planning Reviews, and more
  • This variety ensures models trained on the dataset are equipped to handle complex financial dialogues with contextual accuracy.

    Transcription

    All audio files are accompanied by manually curated, time-coded verbatim transcriptions in JSON format.

  • Transcription Includes:
  • Speaker-Segmented Dialogues
  • 30 hours-coded Segments
  • Non-speech Tags (e.g., pauses, background noise)
  • High transcription accuracy with word error rate < 5% due to double-layered quality checks.
  • These transcriptions are production-ready, making financial domain model training faster and more accurate.

    Metadata

    Rich metadata is available for each participant and conversation:

  • Participant Metadata: ID, age, gender, accent, dialect, and location.
  • Conversation Metadata: Topic, sentiment, call type, sample rate, and technical specs.
  • This granularity supports BFSI-specific analytics, sentiment modeling, and dialect-aware ASR training.

    Usage and Applications

    This dataset is ideal for a range of BFSI voice AI and NLP applications:

  • Automatic Speech Recognition (ASR): Fine-tune Italian speech-to-text systems for financial interactions.
  • Speech Analytics: Extract customer intent and service patterns in banking and insurance.
  • Voice Assistants & Chatbots: Train secure, domain-aware virtual assistants for BFSI customers.
  • Sentiment Analysis: Analyze customer emotions and satisfaction in financial support calls.
  • Generative AI: Use in building summarization or AI agent response models for BFSI use cases.
  • Secure and Ethical Collection

  • All data was collected using “Yugo,” FutureBeeAI’s proprietary platform under strict ethical and security standards.
  • No personally identifiable information is included.
  • The Dataset complies with global data privacy guidelines and is copyright-free.
  • Updates and Customization

    We regularly expand this dataset with fresh call recordings and offer tailored options:

  • Customization Options:
  • Acoustic Environment: Silent or noisy upon request.
  • Sample Rate: Customizable from 8kHz to 48kHz.
  • Transcription Format: Can follow your QA and formatting requirements.
  • License

    This BFSI domain dataset is commercially licensed and ready for integration into your Italian ASR, NLP, or conversational AI pipeline.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Card Head Line

    ATTRIBUTES

    TRANSCRIPTION

    TIME
    TRANSCRIPT
    0.025 - 1.605
    <lang:Foreign>Hey Futurebee<initial>AI</initial></lang:Foreign>
    4.305 - 5.805
    <lang:Foreign>Hey Futurebee<initial>AI</initial></lang:Foreign>
    6.825 - 12.045
    Buongiorno, ha contattato il servizio clienti di Banca Nova, sono <PII>Luca Bianchi. </PII> In cosa posso aiutarla oggi?.
    15.045 - 20.625
    #eh sì buongiorno. Guardi, ho appena controllato il mio estratto ba- conto.
    20.645 - 21.185
    Sì.
    21.285 - 29.285
    E ho notato che il canone mensile è aumentato da quattro a otto euro. Non ho ricevuto nessuna comunicazione. Mi può.
    29.505 - 30.765
    Gentilmente spiegare?
    31.525 - 33.785
    Certo. #eh mi dispiace per la confusione.
    34.265 - 36.445
    #hm capisco perfettamente il suo disappunto.
    36.985 - 39.565
    Le chiedo un attimo per verificare i dettagli sul suo profilo.
    40.245 - 45.905
    Quindi, se mi fornisce gentilmente nome completo o il codice cliente, per favore.
    48.805 - 51.765
    Il codice cliente è uno quattro
    51.725 - 52.665
    Uno quattro.
    55.305 - 56.205
    Tre otto.
    56.585 - 56.885
    Tre
    57.265 - 57.725
    Otto
    58.625 - 60.045
    Okay.
    62.305 - 64.165
    Signora <PII>Federica Rossi</PII>, giusto?
    66.905 - 67.665
    Okay
    67.245 - 67.985
    Giusto.
    69.778 - 74.349
    Perfetto. Vedo che lei ha un conto smart plus aperto dal duemiladiciannove, giusto?
    78.285 - 79.245
    Sì, esatto.
    78.285 - 79.305
    Perfetto.
    79.705 - 80.185
    Allora
    80.605 - 85.825
    Le confermo che a partire da questo mese c'è stata una modifica nelle condizioni economiche di quel tipo di conto.
    86.525 - 89.925
    Il canone è appunto passato da quattro e venti a sette e novanta
    90.625 - 95.665
    #eh questo a causa dell'adeguamento dei costi di gestione e di nuove funzionalità incluse nel pacchetto.
    99.058 - 99.583
    -
    99.745 - 101.345
    Sì, però mi scusi eh
    101.865 - 103.825
    Nuove funzionalità?
    104.105 - 113.905
    Io uso solo l'app per controllare il saldo e fare qualche bonifico. Non ho mai chiesto altro, perché dovrei pagare il doppio?
    114.865 - 118.285
    Comprendo perfettamente. È una domanda assolutamente legittima.
    118.865 - 124.825
    Guardi, le spiego. Il nuovo pacchetto include, tra le altre cose, i bonifici istantanei illimitati.
    125.425 - 128.565
    Commissioni azzerate per prelievi anche fuori circuito.
    129.145 - 131.305
    E un servizio di assistenza prioritaria.
    131.745 - 136.885
    Detto questo, #hm capisco che se non utilizza questo servizi l'aumento può sembrare ingiustificato.
    139.805 - 146.425
    Non è che può sembrare, è ingiustificato. Cioè, va bene che hai fatto un aumento su qualcuno che usa queste cose, ma.
    146.805 - 150.085
    Io che non ne faccio uso perché devo pagare il doppio? Cioè-
    150.405 - 150.585
    #hm
    151.005 - 152.085
    È assurdo.
    152.505 - 152.785
    Cioè
    153.345 - 155.345
    Dire assurdo mi sembra addirittura poco.
    155.905 - 159.165
    Cioè io non ho ricevuto per di più nessuna notifica, cioè
    160.765 - 165.685
    In che mondo viviamo? Almeno avvisate prima, cioè è vostra usanza.
    160.905 - 161.365
    Si lo capisco.
    165.985 - 171.305
    Aumentare i costi delle cose senza avvisare i clienti? Cioè, state avendo a che fare
    172.405 - 172.765
    Con
    173.205 - 177.525
    Cose serie, cioè nel senso non è che stiamo parlando di un abbonamento
    177.965 - 178.925
    A caso.
    180.285 - 189.156
    Capisco, guardi, ha perfettamente ragione. #hm l'aggiornamento è stato comunicato via e-mail e anche tramite l'area clienti, però, #hm può darsi che la notifica sia sfuggita.
    189.183 - 192.682
    Guardi, se vuole posso inviarle nuovamente il documento con tutte le modifiche.
    195.625 - 198.705
    No, cioè certo, me le deve mandare, cioè mi scusi eh.
    199.465 - 200.925
    Mi sembra #hm
    202.485 - 208.365
    Incredibile che poi date la colpa al cliente perché secondo voi non ha visto le notifiche.
    208.805 - 211.965
    Ma in che mondo viviamo? Cioè mi mandi assolutamente tutto.
    212.265 - 214.745
    Perché io queste cose non le ho ricevute.
    216.085 - 221.185
    Mai. Cioè, non è che le ho perse o non le ho viste, non le ho mai ricevute.
    221.765 - 223.045
    Capisco. Certo.
    223.545 - 226.745
    Guardi, #hm se preferisce una soluzione più semplice ed economica.
    226.965 - 231.185
    Possiamo valutare assieme il passaggio al conto, #eh base nuova
    232.185 - 239.505
    Che ha un canone mensile ridotto a due e novanta e mantiene le funzionalità essenziali come l'app, i bonifici standard e la carta di debito.
    242.465 - 250.085
    Cioè, quindi a prescindere, anche se io tornassi al servizio che avevo prima e a usare le cose che già facevo prima.
    250.465 - 255.225
    Devo pagare comunque di più, perché passiamo da due e venti a due e novanta.
    255.985 - 256.225
    Si
    256.565 - 258.685
    Cioè voi comunque mi prendete più soldi
    258.605 - 265.365
    #hm guardi, purtroppo c'è stato un aumento di tutti i servizi di questo tipo e noi dobbiamo comunque adeguarci al mercato.
    265.945 - 271.925
    Sì. #hm purtroppo le opzioni aperte adesso sono queste quindi o rimanere con il-
    272.205 - 274.905
    Tipo di conto che è adesso, con la spesa aumentata, oppure.
    275.425 - 279.265
    Ok. Il Base Nova con i due e novanta. Tenga a mente che comunque-
    279.845 - 283.145
    Ci sono appunto queste #hm
    284.445 - 285.145
    Questi
    285.585 - 286.365
    #eh
    287.865 - 289.245
    Cose in più che abbiamo aggiunto.
    290.265 - 294.185
    Capisco che se non le usa, appunto, non-non è felice.
    294.205 - 299.305
    #hm però al momento le opzioni sono queste, quindi mi dica pure se vuole passare al Base Nova.
    302.605 - 307.385
    Eh, per forza. Cioè non posso perdere la possibilità di fare pagamenti online.
    306.805 - 311.605
    Nessun problema. Allora, il conto base Nova le consente di continuare a fare bonifici online
    311.985 - 314.865
    Pagare bollette, ricaricare il telefono e tutto quanto.
    315.690 - 319.819
    Con l'assistenza prioritaria. Vuole che procediamo con il cambio?
    324.225 - 324.605
    Mah
    325.345 - 331.205
    Ci penso, ma mi sa che non ho altra scelta. Mi mandi tutto per email e così valuto.
    331.605 - 332.105
    Ok
    332.345 - 336.845
    Prima di prendere una decisione definitiva però sappia che mi secca
    337.165 - 338.985
    Pagare per cose che non uso.
    339.565 - 342.005
    Chiaro. Guardi, io le invio subito il documento.
    342.685 - 344.525
    Con le informazioni.
    344.705 - 348.485
    Se hai bisogno di supporto chiami pure e le auguro buona giornata. Grazie.
    351.405 - 353.465
    Va bene, speriamo che almeno sia chiaro.
    353.805 - 354.445
    Grazie.
    354.465 - 355.285
    Grazie a lei arrivo (())

    Dataset Details

    Card Head Line

    Language

    Italian

    Language code

    it

    Country

    Italy

    Accents

    Asti, Avellino ...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70 Years

    File Details

    Card Head Line

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo (dual-channel, separated speakers)

    Audio file duration

    5-15 minutes

    Need datasets for a specific AI/ML use case?
    Don't worry, we've got you covered! 👍

    Contact Us
    Prompt 2 Bg
    Italian Call Center Data for BFSI AI