Italian Call Center Speech Dataset for Retail & E-commerce

This Italian speech dataset features real-world call center conversations from the Retail and E-commerce domain. With detailed metadata and accurate transcriptions, it’s designed to power ASR systems, voice AI, and conversational agents.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

June 2025

Number of participants

60

AI audio dataset for Retail and E-commerce in Italian (Italy)
Download
Download Icon

About this Off-the-shelf Speech Dataset

Card Head Line

Introduction

This Italian Call Center Speech Dataset for the Retail and E-commerce industry is purpose-built to accelerate the development of speech recognition, spoken language understanding, and conversational AI systems tailored for Italian speakers. Featuring over 30 hours of real-world, unscripted audio, it provides authentic human-to-human customer service conversations vital for training robust ASR models.

Curated by FutureBeeAI, this dataset empowers voice AI developers, data scientists, and language model researchers to build high-accuracy, production-ready models across retail-focused use cases.

Speech Data

The dataset contains 30 hours of dual-channel call center recordings between native Italian speakers. Captured in realistic scenarios, these conversations span diverse retail topics from product inquiries to order cancellations, providing a wide context range for model training and testing.

  • Participant Diversity:
  • Speakers: 60 native Italian speakers from our verified contributor pool.
  • Regions: Representing multiple provinces across Italy to ensure coverage of various accents and dialects.
  • Participant Profile: Balanced gender mix (60% male, 40% female) with age distribution from 18 to 70 years.
  • Recording Details:
  • Conversation Nature: Naturally flowing, unscripted interactions between agents and customers.
  • Call Duration: Ranges from 5 to 15 minutes.
  • Audio Format: Stereo WAV files, 16-bit depth, at 8kHz and 16kHz sample rates.
  • Recording Environment: Captured in clean conditions with no echo or background noise.
  • Topic Diversity

    This speech corpus includes both inbound and outbound calls with varied conversational outcomes like positive, negative, and neutral, ensuring real-world scenario coverage.

  • Inbound Calls:
  • Product Inquiries
  • Order Cancellations
  • Refund & Exchange Requests
  • Subscription Queries, and more
  • Outbound Calls:
  • Order Confirmations
  • Upselling & Promotions
  • Account Updates
  • Loyalty Program Offers
  • Customer Verifications, and others
  • Such variety enhances your model’s ability to generalize across retail-specific voice interactions.

    Transcription

    All audio files are accompanied by manually curated, time-coded verbatim transcriptions in JSON format.

  • Transcription Includes:
  • Speaker-Segmented Dialogues
  • 30 hours-coded Segments
  • Non-speech Tags (e.g., pauses, cough)
  • High transcription accuracy with word error rate < 5% due to double-layered quality checks.
  • These transcriptions are production-ready, making model training faster and more accurate.

    Metadata

    Rich metadata is available for each participant and conversation:

  • Participant Metadata: ID, age, gender, accent, dialect, and location.
  • Conversation Metadata: Topic, sentiment, call type, sample rate, and technical specs.
  • This granularity supports advanced analytics, dialect filtering, and fine-tuned model evaluation.

    Usage and Applications

    This dataset is ideal for a range of voice AI and NLP applications:

  • Automatic Speech Recognition (ASR): Fine-tune Italian speech-to-text systems.
  • Speech Analytics: Extract customer insights and behavior patterns.
  • Voice Assistants & Chatbots: Train natural-sounding Italian voice interfaces.
  • Sentiment Analysis: Detect emotion and intent from customer calls.
  • Generative AI: Use in training dialogue generation and summarization models.
  • Secure and Ethical Collection

  • All data was collected using “Yugo,” FutureBeeAI’s proprietary platform under strict ethical and security standards.
  • No personally identifiable information is included.
  • Dataset complies with global data privacy guidelines and is copyright-free.
  • Updates and Customization

    We regularly expand this dataset with fresh recordings and offer tailored options:

  • Customization Options:
  • Acoustic Environment: Silent or noisy upon request.
  • Sample Rate: Customizable from 8kHz to 48kHz.
  • Transcription Format: Can follow your QA and formatting requirements.
  • License

    This dataset is commercially licensed and ready for integration into your ASR, NLP, or voice AI pipeline.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Card Head Line

    ATTRIBUTES

    TRANSCRIPTION

    TIME
    TRANSCRIPT
    0.505 - 1.945
    <lang:Foreign>Hey Futurebee<initial>AI</initial></lang:Foreign>
    3.025 - 4.665
    <lang:Foreign>Hey Futurebee<initial>AI</initial></lang:Foreign>
    7.485 - 11.845
    Buongiorno, grazie per aver chiamato Crea Tuo Stile. Sono <PII>Marco</PII>, in che modo posso aiutarla oggi?
    13.605 - 16.545
    Salve, sto cercando un regalo un po' speciale.
    17.085 - 24.345
    Volevo sapere se fate per caso personalizzazioni su alcuni prodotti, tipo gioielli.
    25.345 - 27.705
    O i regali incisi?
    29.345 - 30.805
    Sì. Certo, assolutamente.
    31.525 - 33.845
    È proprio una delle nostre specialità, tra l'altro.
    34.445 - 37.705
    #um Allora, noi offriamo personalizzazioni su diversi articoli.
    38.165 - 40.825
    #uh Tra cui collane, braccialetti.
    41.525 - 45.705
    Poi abbiamo anche i portachiavi, agente, magliette, anche le tazze se vuole.
    46.325 - 54.065
    #um Non so, lei ha già un prodotto in particolare a cui sta pensando o vuole che le elenco un po' dei nostri prodotti?
    57.365 - 58.265
    #hm
    58.565 - 59.485
    Non lo so.
    60.065 - 65.245
    Cioè, stavo pensando a qualcosa tipo un braccialetto con un'incisione.
    65.645 - 68.205
    Magari una data o un nome.
    69.625 - 74.345
    Ah, perfetto, perfetto. #um Guardi abbiamo i braccialetti incisi che sono richiestissimi.
    75.325 - 80.165
    #uh Tra l'altro può scegliere anche il materiale. Abbiamo acciaio, abbiamo la pelle, argento.
    81.005 - 88.185
    #uh Poi per l'incisione possiamo scrivere nomi, date, anche piccole frasi. Comunque il limite è venticinque caratteri.
    88.865 - 89.885
    #hm
    91.045 - 94.085
    Faccia che l'incisione può essere fatta sia internamente che all'esterno.
    95.005 - 97.285
    #eh a seconda del modello che sceglie
    97.565 - 99.345
    #eh Può anche decidere
    100.085 - 100.645
    #eh
    101.305 - 102.645
    Varie di queste opzioni insomma.
    105.265 - 112.765
    Una domanda, per caso posso vederlo prima che sia, cioè prima di andare a ritirarlo?
    106.485 - 106.765
    Sì.
    114.545 - 120.785
    Allora, può vedere il prodotto in sé, però chiaramente per l'incisione non può vedere il prodotto finito.
    121.125 - 125.705
    Se vuole in negozio abbiamo degli esempi, chiaramente non con l'incisione che mi dirà lei.
    126.405 - 127.605
    #eh
    128.105 - 130.845
    Però sì, diciamo che qua abbiamo un po' di prodotti già incisi.
    132.925 - 134.025
    Ok, ok.
    134.765 - 136.065
    #eh
    136.565 - 137.985
    Ok, va bene.
    138.325 - 141.785
    Ehm, più o meno quanto ci mettete a consegnare? Ah-
    143.385 - 150.585
    Mmh. Allora, eh per i prodotti personalizzati ci vogliono di solito tra i cinque e i sette giorni lavorativi per la lavorazione.
    151.485 - 154.605
    Eh, poi oltre a quello ci sono due o tre giorni per la consegna. Ok.
    155.405 - 161.505
    Sì Però se ho una data specifica in mente, posso verificare al volo se possiamo accelerare magari i tempi.
    164.225 - 165.125
    Mmmh. Sì.
    165.685 - 168.445
    È un regalo per il mio anniversario e quindi è perfetto. Mm mm.
    168.905 - 169.165
    Giusto. Per apportare...
    169.545 - 170.205
    tra poco. Eh-
    170.625 - 173.425
    Dieci giorni all'incirca. Ce la facciamo? Sì, ce la facciamo.
    171.705 - 172.285
    Proprio. Mmh-mmh.
    173.605 - 174.005
    Capito.
    174.745 - 182.905
    Guardi, mmm penso di sì. Se riusciamo a confermare l'ordine entro oggi, se si riesce a mettermelo entro oggi, possiamo metterlo subito in lavorazione.
    184.045 - 185.505
    Eehm...
    185.945 - 189.545
    E poi le faccio appunto sapere se ce la facciamo. Comunque penso proprio di sì.
    190.165 - 190.805
    Eh... Mm.
    191.445 - 195.105
    Che personalizzazione stava pensando? Cosa desidera? Eh.
    197.365 - 200.905
    Vorrei che ci fosse scritto per sempre.
    202.345 - 202.665
    Gi
    202.745 - 203.085
    Sì.
    203.165 - 204.025
    Emme.
    205.085 - 208.185
    Quattordici zero cinque duemilaventuno.
    210.025 - 210.765
    Molto bello.
    211.385 - 214.245
    Quindi, guardi, lo scrivo giù adesso.
    214.665 - 218.325
    Mi serve sapere anche i caratteri proprio nello specifico.
    218.825 - 220.185
    Metto per sempre.
    221.005 - 221.625
    Virgola.
    222.025 - 222.485
    -
    222.645 - 223.005
    Sì.
    223.145 - 223.905
    (())
    224.325 - 225.965
    La E mettiamo la E commerciale.
    228.485 - 229.465
    Sì, va bene.
    228.485 - 234.425
    E poi, e poi pensavamo trattino quattordici punto zero cinque punto duemilaventuno.
    235.085 - 235.105
    Che ne dice?
    237.245 - 243.265
    Si può fare senza il trattino scrivendo la data sotto al per sempre GI ELLE?
    244.265 - 246.059
    Assolutamente sì, certo.
    246.105 - 248.225
    Lo scrivo subito
    249.585 - 250.485
    Ok.
    250.845 - 253.085
    #eh Vuole aggiungere anche una confezione regalo?
    255.325 - 256.805
    #eh Sì, perché no?
    257.065 - 258.045
    Che opzioni avete?
    259.265 - 260.105
    Allora.
    260.605 - 263.585
    Ok. Confezioni regalo abbiamo in carta <lang:Foreign>craft</lang:Foreign> elegante.
    264.625 - 271.885
    Oppure scatolina rigida, nero marrone con fiocco. Possiamo anche inserire un bigliettino con un messaggio, se vuole.
    274.185 - 276.785
    Ok, perfetto. #um
    277.725 - 279.065
    Potrebbe scrivere
    279.165 - 280.225
    Con amore
    280.845 - 281.885
    Per sempre?
    282.905 - 283.545
    Ma certo.
    284.725 - 288.985
    Ok, l'ho segnato. E allora procedo con il braccialetto in acciaio.
    289.805 - 290.905
    Se me lo conferma.
    291.745 - 293.385
    Sì, sì, in acciaio va benissimo.
    293.265 - 293.705
    Okay.
    293.845 - 297.525
    Incisione come indicato. Confezione rigida con biglietto.
    298.085 - 301.065
    E le invio subito una mail di conferma con tutti i dettagli.
    301.765 - 309.865
    #eh Poi lì in allegato ci sarà il link per completare il pagamento e appena riceviamo il pagamento, #eh l'ordine andrà subito in lavorazione, quindi.
    310.145 - 313.505
    Dovrebbe arrivare perfettamente per il giorno indicato.
    316.065 - 316.905
    Perfetto.
    317.085 - 319.505
    Grazie mille per la, per la disponibilità.
    320.145 - 327.165
    È un piacere. Se ha bisogno di modifiche o domande, può rispondere direttamente alla mail oppure mi chiama di nuovo senza problemi.
    327.665 - 329.185
    E facciamo le modifiche.
    329.265 - 332.085
    Buona giornata e buon anniversario in anticipo.
    333.785 - 335.925
    Grazie mille, buona giornata e buon lavoro.
    336.465 - 337.005
    Arrivederci.

    Dataset Details

    Card Head Line

    Language

    Italian

    Language code

    it

    Country

    Italy

    Accents

    Asti, Avellino ...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70 Years

    File Details

    Card Head Line

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo (dual-channel, separated speakers)

    Audio file duration

    5-15 minutes

    Need datasets for a specific AI/ML use case?
    Don't worry, we've got you covered! 👍

    Contact Us
    Prompt 2 Bg