Italian Call Center Speech Dataset for Delivery & Logistics

This Italian speech dataset features real-world call center conversations from the Delivery & Logistics domain. With detailed metadata and accurate transcriptions, it’s designed to power ASR systems, voice AI, and conversational agents.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

June 2025

Number of participants

60

AI audio dataset for Delivery & Logistics in Italian (Italy)
Download
Download Icon

About this Off-the-shelf Speech Dataset

Card Head Line

Introduction

This Italian Call Center Speech Dataset for the Delivery and Logistics industry is purpose-built to accelerate the development of speech recognition, spoken language understanding, and conversational AI systems tailored for Italian-speaking customers. With over 30 hours of real-world, unscripted call center audio, this dataset captures authentic delivery-related conversations essential for training high-performance ASR models.

Curated by FutureBeeAI, this dataset empowers AI teams, logistics tech providers, and NLP researchers to build accurate, production-ready models for customer support automation in delivery and logistics.

Speech Data

The dataset contains 30 hours of dual-channel call center recordings between native Italian speakers. Captured across various delivery and logistics service scenarios, these conversations cover everything from order tracking to missed delivery resolutions offering a rich, real-world training base for AI models.

  • Participant Diversity:
  • Speakers: 60 native Italian speakers from our verified contributor pool.
  • Regions: Multiple provinces of Italy for accent and dialect diversity.
  • Participant Profile: Balanced gender distribution (60% male, 40% female) with ages ranging from 18 to 70.
  • Recording Details:
  • Conversation Nature: Naturally flowing, unscripted customer-agent dialogues.
  • Call Duration: 5 to 15 minutes on average.
  • Audio Format: Stereo WAV, 16-bit depth, recorded at 8kHz and 16kHz.
  • Recording Environment: Captured in clean, noise-free, echo-free conditions.
  • Topic Diversity

    This speech corpus includes both inbound and outbound delivery-related conversations, covering varied outcomes (positive, negative, neutral) to train adaptable voice models.

  • Inbound Calls:
  • Order Tracking
  • Delivery Complaints
  • Undeliverable Addresses
  • Return Process Enquiries
  • Delivery Method Selection
  • Order Modifications, and more
  • Outbound Calls:
  • Delivery Confirmations
  • Subscription Offer Calls
  • Incorrect Address Follow-ups
  • Missed Delivery Notifications
  • Delivery Feedback Surveys
  • Out-of-Stock Alerts, and others
  • This comprehensive coverage reflects real-world logistics workflows, helping voice AI systems interpret context and intent with precision.

    Transcription

    All recordings come with high-quality, human-generated verbatim transcriptions in JSON format.

  • Transcription Includes:
  • Speaker-Segmented Dialogues
  • Time-coded Segments
  • Non-speech Tags (e.g., pauses, noise)
  • High transcription accuracy with word error rate under 5% via dual-layer quality checks.
  • These transcriptions support fast, reliable model development for Italian voice AI applications in the delivery sector.

    Metadata

    Detailed metadata is included for each participant and conversation:

  • Participant Metadata: ID, age, gender, region, accent, dialect.
  • Conversation Metadata: Topic, call type, sentiment, sample rate, and technical attributes.
  • This metadata aids in training specialized models, filtering demographics, and running advanced analytics.

    Usage and Applications

    This dataset is ideal for a range of AI and NLP use cases in the delivery and logistics industry:

  • Automatic Speech Recognition (ASR): Build or fine-tune Italian speech-to-text systems.
  • Speech Analytics: Gain insights from customer feedback and logistics-related interactions.
  • Voice Assistants & Chatbots: Enable automated support for deliveries, returns, and updates.
  • Sentiment Analysis: Detect frustration, urgency, or satisfaction in delivery-related calls.
  • Generative AI: Train Italian generative models for summarization, call simulation, or support scripts.
  • Secure and Ethical Collection

  • Data collected via FutureBeeAI’s secure platform, “Yugo,” under strict ethical standards.
  • No personally identifiable information is included.
  • Compliant with global data privacy regulations and copyright-free.
  • Updates and Customization

    We regularly update this dataset with fresh audio and offer full customization:

  • Customization Options:
  • Acoustic Conditions: Silent or noisy environments on request.
  • Sample Rate: Configurable between 8kHz and 48kHz.
  • Transcription Format: Custom guidelines or formatting accepted.
  • License

    This Delivery and Logistics domain dataset is commercially licensed and ready for use in ASR, NLP, and voice automation projects in Italian.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Card Head Line

    ATTRIBUTES

    TRANSCRIPTION

    TIME
    TRANSCRIPT
    1.425 - 3.165
    <lang:Foreign>Hey Futurebee<initial>AI</initial></lang:Foreign>
    4.905 - 6.385
    <lang:Foreign>Hey Futurebee<initial>AI</initial></lang:Foreign>
    11.245 - 15.645
    (()) Verde <initial>SRL</initial>, sono Alfonso. Come posso aiutarla?
    17.405 - 26.905
    #eh pronto? Buonasera. Io #um allora mi chiamo <PII>Anastasia Mirra</PII> e #um telefono perché avrei bisogno di avere alcune informazioni relativamente a una spedizione.
    27.305 - 35.245
    #er Che ho fatto la scorsa settimana e che #um non è ancora arrivata, però io non riesco a fare il <lang:Foreign>tracking online</lang:Foreign>.
    35.545 - 36.925
    #er quindi #um
    36.575 - 44.705
    Ok. Va bene. Signora, scusi #eh la interrompo. Se gentilmente mi dà- lei ha, ha modo di vedere il numero di spedizione? Il numero di spedizione è quel numero-
    45.525 - 46.625
    Di sei cifre.
    46.985 - 54.785
    Che dovrebbe vedere sulla #er o sulla carta, sul cartaceo che le ha consegnato il corriere, oppure sull' <lang:Foreign>email</lang:Foreign> di conferma
    53.545 - 54.185
    Sì, sì.
    56.425 - 66.045
    Sì, ce l'ho. Allora, il- Glielo leggo. Allora sono- è alfanumerico, in realtà, non sono solo cifre, c'è un <initial>TK</initial> otto sei sei sei.
    58.085 - 59.425
    Sì, mi dica.
    59.465 - 59.745
    #hm
    61.625 - 63.705
    Sì, sì, va bene.
    65.085 - 65.645
    Ok.
    68.305 - 71.165
    Ok, va bene. Allora un attimo solo.
    71.554 - 71.919
    73.305 - 78.545
    Dunque, questa è una spedizione che è #er partita due giorni fa da Rovigo.
    79.185 - 80.825
    Ed è diretta a Milano.
    80.339 - 80.564
    81.405 - 83.085
    #er
    83.905 - 85.045
    Sì, a Milano.
    85.825 - 95.945
    Però, #er diciamo, doveva arrivare oggi, però io i dati di oggi non li vedo ancora, diciamo come consegna. Quindi. Dovrei fare una verifica insomma.
    96.625 - 100.725
    Perché in effetti era prevista la consegna oggi, ma non #er
    98.265 - 99.185
    Sì, però-
    101.885 - 103.625
    Non è arrivata perché risulta ancora (())
    102.625 - 111.545
    Non è ancora arrivato, ma- ma fino a che ora consegnate? A che ora consegnate, fino a tardi? Oppure dipende dal- dal vettore in quel momento? Perché, s- so per s-
    104.225 - 105.605
    Risulta ancora in transito.
    105.945 - 106.205
    #hm
    110.350 - 115.209
    Ma guardi, in effetti qui è segnato che, #er diciamo
    115.805 - 117.365
    Non- #er
    118.205 - 130.765
    Facilmente non verrà consegnata di oggi, però adesso se lei mi attende un attimo vado a verificare perché diciamo ci sono stati dei ritardi oggi sulle consegne. Se lei mi attende gentilmente un attimo.
    130.305 - 130.815
    #hm
    130.825 - 133.005
    Che verifico, un attimo solo.
    133.125 - 134.345
    Prego, prego. Sì.
    136.245 - 140.684
    Sì, eccomi signora, scusi #eh. Scusi per l'attesa. Allora ho verificato
    140.845 - 150.085
    E in effetti la spedizione è ancora in transito. È #er è presso uno dei nostri <lang:Foreign>hub</lang:Foreign>, uno dei nostri centri di deposito.
    150.665 - 155.985
    #er quindi diciamo verrà nuovamente messa in spedizione domani.
    157.285 - 161.905
    E quindi la spedizione e la consegna è prevista
    162.665 - 165.625
    Per dopodomani a- a Milano.
    166.665 - 169.405
    Quindi la spedizione arriverà a Milano #er
    169.825 - 175.825
    V-Venerdì in #er Adesso le dico la conferma anche dell'indirizzo.
    169.885 - 170.425
    Ok
    176.345 - 181.785
    Dunque Milano s-so- praticamente corso- mi dà Corso Vercelli dodici.
    182.605 - 183.305
    Milano.
    184.385 - 188.445
    Esatto. Esatto, esatto. Il destinatario, la <PII>Marisa Nicoli</PII>.
    190.145 - 196.945
    Sì, <PII>Marisa Nicoli</PII>, però qui io vedo #er in effetti manca il numero- il numero di telefono del riferimento. Sarebbe-
    197.345 - 202.605
    Sarebbe meglio segnalarlo. #er Quindi se lei gentilmente mi può dare un riferimento-
    200.885 - 203.025
    #eh Il numero di telefono- il
    202.905 - 204.925
    Ma guardi, mi può dare anche-
    204.125 - 205.645
    Persona (())
    205.005 - 212.925
    O quello della signora o s- o-o-o un altro, anche un altro riferimento, perché normalmente non viene usato, le spiego.
    213.405 - 216.785
    #er però può essere quel corriere se ci sono dei problemi.
    215.285 - 215.945
    Ok.
    217.405 - 220.785
    Nel momento in cui fa la consegna, perché magari non trova-
    218.405 - 219.305
    Certo, magari
    221.245 - 230.765
    Al citofono, la persona per consegnarlo, ci sono dei problemi di quel genere, può essere che magari faccia il numero di telefono. Dato che però qui non è segnato.
    230.790 - 233.585
    Per qualche motivo, ecco. Se gentilmente me lo dà.
    231.445 - 231.805
    Certo
    232.065 - 237.805
    No, no, glielo dico. Le dico il numero di cellulare, del mio cellulare, così almeno lo trovate comunque in qualsiasi momento.
    235.145 - 235.525
    Sì.
    236.025 - 236.385
    (())
    238.005 - 241.185
    #um allora #er dunque il numero è tre nove sette
    238.605 - 239.085
    Ok.
    243.145 - 243.545
    Ok.
    243.665 - 244.905
    Quattro sei due
    245.005 - 245.425
    Sì.
    246.785 - 247.205
    Sì.
    246.965 - 247.425
    (()) tre
    248.545 - 249.085
    Ok.
    249.325 - 254.965
    Va bene. Allora, questo l'ho segnato. Tra l'altro io vedo qui che ci sono delle- degli oneri di spedizione. Non so se-
    250.085 - 250.685
    Ok.
    255.585 - 257.705
    Lo sa? Cioè nel senso che la consegna-
    258.945 - 263.425
    Si deve pagare, #er ci sono degli oneri di consegna.
    261.705 - 262.265
    #um
    263.705 - 268.565
    Che dovranno essere, diciamo, corrisposti, dovranno essere pagati alla consegna. Adesso non so se lei lo sa
    269.665 - 272.579
    Però diciamo- il destinatari deve #er deve paga-
    271.345 - 273.505
    #er no, a me risultava di aver-
    272.665 - 275.159
    Sì, sì, deve pagare il tratto in contanti
    274.965 - 281.945
    Risultava di aver pagato. Io ho pagato la-la spedizione, per cui non mi era stato assolutamente detto che ce ne (())
    280.025 - 282.579
    No, no, no ma perché questo è passato nella dogana
    283.265 - 288.125
    E quindi con la dogana io posso andare a vedere esattamente la cifra. Diciamo che-
    288.465 - 295.505
    #er andrebbero preparati i soldi in contanti. Comunque tutt-tutta la documentazione della dogana poi le viene data-
    295.460 - 295.925
    #eh
    295.885 - 304.645
    #er durante diciamo con la consegna, #er riceve- il destinatario riceve anche il documento della-della dogana. Adesso le dico-
    305.305 - 307.985
    Il valore diciamo da-
    309.405 - 314.825
    Da pagare, dunque sono sedici euro e venti. Sedici punto venti euro.
    316.585 - 317.805
    Questo è quanto-
    317.371 - 319.171
    Sedici euro e venti. Sì
    319.254 - 333.265
    No, io questa cosa, dato che non ero al corrente, #er la spedizione è praticamente un regalo, io non posso far pagare la persona- il destinatario questi oneri, per cui o li saldo io precedentemente con #er Mi dica lei come?
    332.705 - 333.905
    Sì, può farlo, sì sì
    333.405 - 334.225
    #er
    334.305 - 339.225
    Sì, è pos-è possibile. Allora, cioè lei va sul sito nostro di Spedizioni Veloci <initial>SRL</initial>
    339.705 - 347.865
    #er Dove ha provato a vedere anche il <lang:Foreign>tracking</lang:Foreign>. Allora, se va #er inserendo i dati della spedizione-
    340.790 - 341.410
    -
    348.185 - 358.445
    Troverà una finestra dove è #er scritto #er oneri, oneri doganali. Allora se lei va dentro lì a oneri doganali c'è la possibilità di pagare-
    355.545 - 356.045
    Ok
    356.265 - 356.665
    Sì.
    359.665 - 363.465
    Prima della consegna, quindi può già farlo praticamente, può già farlo da oggi.
    359.865 - 360.325
    (())
    360.645 - 360.845
    (())
    364.045 - 373.025
    Lei si- va in quest'area qua, inserisce una ca- i dati di una carta di credito e viene pagato e quindi il destinatario non #er
    365.525 - 365.865
    Ok.
    366.865 - 367.885
    #ah senta
    373.685 - 376.885
    Non #er non dovrà sborsare nulla. Va bene?
    375.975 - 376.320
    Bene
    377.945 - 389.345
    Infatti. Senta gentilmente però io adesso faccio questo tentativo però avevo già provato oggi ad entrare nel sito e non-non vedevo la spedizione, ma questo perché? Perché #er è in transito?
    387.405 - 389.265
    Eh no, ci sono stati dei problemi.
    389.505 - 393.105
    Adesso guardi, ci sono sempre dei problemi, ma se prova adesso
    393.425 - 397.045
    Funziona. Oggi ci sono stati problemi, ma adesso sta funzionando tutto, quindi.
    395.265 - 395.450
    (())
    397.275 - 401.029
    Può farlo tranquillamente. Poi se ci sono problemi, ci richiama. Va bene?
    398.005 - 398.685
    Sta funzionando.
    398.725 - 399.265
    Ok.
    402.245 - 407.485
    Va bene, allora io faccio accesso nella mia area personale, pago gli oneri e poi la consegna per venerdì comunque.
    406.845 - 407.225
    Ok
    408.009 - 410.469
    Ok, d'accordo. Va bene, grazie mille.
    408.325 - 409.905
    Va bene, (())
    409.945 - 412.605
    La ringrazio per averci chiamato. Buonasera, grazie.
    412.965 - 413.485
    Sì buonasera

    Dataset Details

    Card Head Line

    Language

    Italian

    Language code

    it

    Country

    Italy

    Accents

    Asti, Avellino ...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70 Years

    File Details

    Card Head Line

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo (dual-channel, separated speakers)

    Audio file duration

    5-15 minutes

    Need datasets for a specific AI/ML use case?
    Don't worry, we've got you covered! 👍

    Contact Us
    Prompt 2 Bg