Italian Call Center Speech Dataset for Travel

This Italian speech dataset features real-world call center conversations from the Travel domain. With detailed metadata and accurate transcriptions, it’s designed to power ASR systems, voice AI, and conversational agents.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

June 2025

Number of participants

60

AI audio dataset for Travel in Italian (Italy)
Download
Download Icon

About this Off-the-shelf Speech Dataset

Card Head Line

Introduction

This Italian Call Center Speech Dataset for the Travel industry is purpose-built to power the next generation of voice AI applications for travel booking, customer support, and itinerary assistance. With over 30 hours of unscripted, real-world conversations, the dataset enables the development of highly accurate speech recognition and natural language understanding models tailored for Italian -speaking travelers.

Created by FutureBeeAI, this dataset supports researchers, data scientists, and conversational AI teams in building voice technologies for airlines, travel portals, and hospitality platforms.

Speech Data

The dataset includes 30 hours of dual-channel audio recordings between native Italian speakers engaged in real travel-related customer service conversations. These audio files reflect a wide variety of topics, accents, and scenarios found across the travel and tourism industry.

  • Participant Diversity:
  • Speakers: 60 native Italian contributors from our verified pool.
  • Regions: Covering multiple Italy provinces to capture accent and dialectal variation.
  • Participant Profile: Balanced representation of age (18–70) and gender (60% male, 40% female).
  • Recording Details:
  • Conversation Nature: Naturally flowing, spontaneous customer-agent calls.
  • Call Duration: Between 5 and 15 minutes per session.
  • Audio Format: Stereo WAV, 16-bit depth, at 8kHz and 16kHz.
  • Recording Environment: Captured in controlled, noise-free, echo-free settings.
  • Topic Diversity

    Inbound and outbound conversations span a wide range of real-world travel support situations with varied outcomes (positive, neutral, negative).

  • Inbound Calls:
  • Booking Assistance
  • Destination Information
  • Flight Delays or Cancellations
  • Support for Disabled Passengers
  • Health and Safety Travel Inquiries
  • Lost or Delayed Luggage, and more
  • Outbound Calls:
  • Promotional Travel Offers
  • Customer Feedback Surveys
  • Booking Confirmations
  • Flight Rescheduling Alerts
  • Visa Expiry Notifications, and others
  • These scenarios help models understand and respond to diverse traveler needs in real-time.

    Transcription

    Each call is accompanied by manually curated, high-accuracy transcriptions in JSON format.

  • Transcription Includes:
  • Speaker-Segmented Dialogues
  • Time-Stamped Segments
  • Non-speech Markers (e.g., pauses, coughs)
  • High transcription accuracy by dual-layered transcription review ensures word error rate under 5%.
  • Metadata

    Extensive metadata enriches each call and speaker for better filtering and AI training:

  • Participant Metadata: ID, age, gender, region, accent, and dialect.
  • Conversation Metadata: Topic, domain, call type, sentiment, and audio specs.
  • Usage and Applications

    This dataset is ideal for a variety of AI use cases in the travel and tourism space:

  • ASR Systems: Train Italian speech-to-text engines for travel platforms.
  • Speech Analytics: Uncover customer insights and travel behavior patterns.
  • Chatbots & Voice Assistants: Develop Italian -speaking travel agents.
  • Sentiment Detection: Analyze customer tone for better service delivery.
  • Generative AI: Fine-tune LLMs for summarizing or responding to traveler requests.
  • Secure and Ethical Collection

  • All data is collected via FutureBeeAI’s secure platform, “Yugo.”
  • No personally identifiable information is captured.
  • Compliant with data protection regulations and copyright-safe.
  • Updates and Customization

    We regularly expand this dataset with fresh audio and provide custom options:

  • Customization Options:
  • Environment: Silent, noisy, or varied real-world conditions on request.
  • Sample Rate: Adjustable from 8kHz to 48kHz.
  • Transcription: Custom formats and QA guidelines available.
  • License

    This travel-focused Italian call center dataset is commercially licensed and ready for enterprise or research deployment.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Card Head Line

    ATTRIBUTES

    TRANSCRIPTION

    TIME
    TRANSCRIPT
    0.005 - 4.865
    <lang:Foreign>Hey Futurebee <initial>AI</initial></lang:Foreign>. Grazie per aver chiamato il servizio clienti.
    5.845 - 8.405
    Mi chiamo <PII>Marco</PII>, come posso aiutarla oggi?
    11.185 - 13.065
    <lang:Foreign>Hey Futurebee <initial>AI</initial></lang:Foreign>
    21.665 - 29.205
    Sto pianificando un viaggio all'estero e vorrei avere maggiori dettagli sulla mia assicurazione di viaggio. Potete dirmi cosa copre esattamente?
    31.825 - 39.325
    Certo, sarò felice di aiutarla. Potrebbe fornirmi il suo nome e il numero di polizza, così posso verificare i dettagli della sua copertura?
    41.465 - 42.065
    Certo
    42.685 - 43.445
    #eh #hm
    44.045 - 49.745
    Mi chiamo <PII>Lucia</PII> Bianchi e il mio numero di polizza è <initial>TRV</initial> <PII>cinque sei sette otto nove</PII>
    51.545 - 55.065
    Grazie signora Bianchi, sto controllando la sua polizza di viaggio.
    56.305 - 70.165
    #hm dunque, vedo che ha una copertura standard per viaggi internazionali. Questa policy include spese mediche di emergenza, cancellazione del viaggio per cause impreviste, copertura per bagagli smarriti o danneggiati.
    70.605 - 76.305
    E assistenza in caso di emergenza. C'è qualcosa in particolare su cui vuole avere maggiori dettagli?
    80.145 - 85.565
    Sì, volevo sapere se sono coperta nel caso in cui debba cancellare il viaggio per motivi di salute.
    85.825 - 89.805
    #hm. Ad esempio, se mi ammalo prima di partire posso chiedere un rimborso.
    91.125 - 96.765
    Ottima domanda. Sì, la sua polizza prevede il rimboso per concellazioni legate a motivi di salute.
    97.425 - 107.325
    Purché sia fornita una documentazione medica valida. In caso di malattia prima della partenza, dovrebbe inviarci un certificato medico che confermi la sua impossibilità a viaggiare.
    107.865 - 114.665
    In quel caso, il rimborso dipenderebbe dai costi effettivi del viaggio e dalla condizione della sua prenotazione.
    117.885 - 124.525
    Capisco e per quanto riguarda il Covid-diciannove, se dovessi risultare positivo prima della partenza o durante il viaggio?
    127.145 - 133.285
    #eh domanda pertinente. Sì, la sua polizza include la copertura per spese mediche legate al Covid-diciannove.
    134.505 - 138.905
    E anche per cancellazioni dovute a un test positivo prima della partenza.
    139.145 - 146.185
    Tuttavia è importante sottolineare che non copre le cancellazioni dovute a restrizioni di viaggio imposte dai governi.
    146.945 - 150.505
    O a lockdown improvvisi nel paese di destinazione.
    151.405 - 156.805
    Se dovesse #hm incontrare il virus mentre all'estero sarebbero coperte le spese ospedaliere.
    157.065 - 161.585
    Il prolungamento del soggiorno dovuto alla quarantena obbligatoria.
    163.745 - 166.205
    #hm perfetto, questo mi tranquillizza.
    166.485 - 171.885
    #eh un'altra cosa, cosa succede se perdo il volo a causa di un ritardo della compagnia aerea?
    173.925 - 179.325
    Se il ritardo è causato dalla compagnia aerea, purtroppo la polizza non copre direttamente il rimborso del biglietto.
    179.745 - 184.525
    Tuttavia, se il ritardo supera le sei ore e ha impatto sul resto del viaggio
    184.665 - 191.545
    Potrebbe avere diritto a un rimborso parziale per spese extra come hotel, pasti o prenotazioni perse.
    191.765 - 199.905
    È importante tenere sempre ricevute delle spese e richiedere alla compagnia aerea una dichiarazione ufficiale del ritardo.
    202.505 - 209.485
    #hm ok, ok. Quindi se il volo è in ritardo e devo pagare un pernottamento extra posso chiedere un rimborso.
    210.285 - 216.465
    Esattamente. Basta conservare tutte le ricevute e inoltrare la richiesta di rimborso attraverso il nostro portale online
    216.925 - 219.025
    O contattando il nostro servizio clienti.
    219.474 - 223.854
    Di solito queste richieste vengono elaborate in cinque-sette giorni lavorativi.
    226.705 - 234.825
    #hm perfetto. #hm un'ultima domanda. Se durante il viaggio dovessi avere bisogno di assistenza medica urgente, come devo procedere?
    238.205 - 246.345
    Sì questo è giusto chiederlo. Se si trova all'estero e ha bisogno di cure mediche urgenti la prima cosa da fare è contattare il nostro servizio
    246.545 - 251.005
    Di emergenza attivo ventiquattro.
    251.245 - 253.365
    Al giorno, per sette giorni alla settimana.
    253.725 - 259.645
    E le verrà assegnato un referente che la guiderà su quali ospedali o cliniche sono convenzionate
    260.145 - 270.565
    Nella zona in nella quale si trova. In caso di emergenza grave, se le cure non sono disponibili nel paese in cui si trova, potrebbe anche essere organizzato un rimpatrio sanitario.
    274.205 - 278.185
    Wow, non sapevo che fosse possibile un rimpatrio sanitario.
    278.245 - 281.205
    Ma è incluso nella mia polizza o devo pagare un extra?
    283.305 - 290.265
    Nella sua polizza è incluso fino a un massimo di cinquantamila euro per il rimpatrio medico.
    290.545 - 292.565
    Se le spese superano
    293.125 - 297.185
    Questa cifra ci potrebbe essere una parte non coperta.
    297.865 - 304.825
    Ma nella maggior parte dei casi, questa somma è sufficiente per coprire il trasporto medico d'urgenza.
    309.765 - 317.985
    Ottimo, è un'informazione davvero utile. Quindi se succede qualcosa basta contattare il numero di emergenza e mi direte tutto voi?
    320.285 - 323.825
    Esatto, basta contattare il nostro numero di emergenza che
    324.285 - 327.465
    È attivo sempre ventiquattr'ore su ventiquattro
    328.525 - 333.685
    E un operatore la aiuterà a gestire la situazione nel migliore dei modi.
    335.825 - 336.905
    #uh fantastico.
    337.125 - 341.725
    #eh mi sento molto più tranquilla adesso. Grazie per tutte queste informazioni.
    341.965 - 346.465
    #eh non ero sicura di cosa fosse incluso ma ora ho tutto più chiaro.
    348.525 - 355.465
    Mi fa piacere sentirlo, signora Bianchi. Se ha bisogno eventualmente di altre informazioni
    355.905 - 358.705
    O se vuole per qualsiasi momen~
    359.165 - 362.985
    Evenienza aggiungere una copertura extra
    363.365 - 365.365
    Per attività specifiche
    365.785 - 370.825
    Come per esempio sport estremi che vuole praticare sul posto.
    372.325 - 382.785
    Nel posto in cui si trova, oppure viaggi prolungati, escursioni, cose del genere, sono sempre a sua disposizione per aiutarla a personalizzare la polizza.
    384.725 - 387.685
    No, per ora penso che vada bene così. Grazie.
    389.665 - 399.245
    Di nulla. Le auguro un viaggio sicuro e sereno. Se dovesse avere altre domande non esiti a contattarci. Buona giornata.
    400.445 - 401.785
    Buona giornata anche a lei.

    Dataset Details

    Card Head Line

    Language

    Italian

    Language code

    it

    Country

    Italy

    Accents

    Asti, Avellino ...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70 Years

    File Details

    Card Head Line

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo (dual-channel, separated speakers)

    Audio file duration

    5-15 minutes

    Need datasets for a specific AI/ML use case?
    Don't worry, we've got you covered! 👍

    Contact Us
    Prompt 2 Bg