German (Germany) Call Center Speech Dataset for BFSI

The audio dataset comprises call center conversations for the BFSI domain, featuring native German speakers from Germany. It includes speech data, detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

Jun 2024

Number of participants

60

AI voice dataset for BFSI in English (USA)
Download
Download Icon

About this Off-the-shelf Speech Dataset

Card Head Line

Introduction

Welcome to the German Call Center Speech Dataset for the BFSI domain designed to enhance the development of call center speech recognition models specifically for the BFSI industry. This dataset is meticulously curated to support advanced speech recognition, natural language processing, conversational AI, and generative voice AI algorithms.

Speech Data

This training dataset comprises 30 Hours of call center audio recordings covering various topics and scenarios related to the BFSI domain, designed to build robust and accurate customer service speech technology.

  • Participant Diversity:
  • Speakers: 60 People expert native German speakers from the FutureBeeAI Community.
  • Regions: Different states/provinces of Germany, ensuring a balanced representation of German accents, dialects, and demographics.
  • Participant Profile: Participants range from 18 to 70 years old, representing both males and females in a 60:40 ratio, respectively.
  • Recording Details:
  • Conversation Nature: Unscripted and spontaneous conversations between call center agents and customers.
  • Call Duration: Average duration of 5 to 15 minutes per call.
  • Formats: WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 and 16 kHz.
  • Environment: Without background noise and without echo.
  • Topic Diversity

    This dataset offers a diverse range of conversation topics, call types, and outcomes, including both inbound and outbound calls with positive, neutral, and negative outcomes.

  • Inbound Calls:
  • Debit Card Block Request
  • Home Loan Enquiry
  • Transaction Disputes
  • Credit Card Billing Dispute
  • Account Closure Procedures
  • Claim Procedures
  • Premium Payments
  • Policy Comparison
  • Policy Cancellation or Lapse
  • Insurance Renewal Options
  • Retirement Planning
  • Investment Risk Assessment Questionnaires
  • Tax-efficient Investment Strategies
  • Investment Performance Enquiry, and many more
  • Outbound Calls:
  • Credit Card Offers
  • Loan Offers
  • Loyalty Program Benefits
  • Customer Satisfaction Surveys
  • EMI Reminder Call
  • Policy Upgrade Offers
  • Claim Status Updates
  • Policyholder Loyalty Benefits
  • Insurance Policyholder Surveys
  • Term Life Insurance Offer
  • Investment Opportunities
  • Retirement Savings Review, and many more
  • This extensive coverage ensures the dataset includes realistic call center scenarios, which is essential for developing effective customer support speech recognition models.

    Transcription

    To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. These transcriptions feature:

  • Speaker-wise Segmentation: Time-coded segments for both agents and customers.
  • Non-Speech Labels: Tags and labels for non-speech elements.
  • Word Error Rate: Word error rate is less than 5% thanks to the dual layer of QA.
  • These ready-to-use transcriptions accelerate the development of the BFSI domain call center conversational AI and ASR models for the German language.

    Metadata

    The dataset provides comprehensive metadata for each conversation and participant:

  • Participant Metadata: Unique identifier, age, gender, country, state, district, accent and dialect.
  • Conversation Metadata: Domain, topic, call type, outcome/sentiment, bit depth, and sample rate.
  • This metadata is a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of German call center speech recognition models.

    Usage and Applications

    This dataset can be used for various applications in the fields of speech recognition, natural language processing, and conversational AI, specifically tailored to the BFSI domain. Potential use cases include:

  • Speech Recognition Models: Training and fine-tuning speech recognition models for German.
  • Speech Analytics Models: Building speech analytics models to extract insights, identify patterns, and glean valuable information from customer conversation, enables data-driven decision-making and process optimization within the BFSI sector.
  • Smart Assistants and Chatbots: Developing conversational agents and virtual assistants for customer service in the BFSI industries.
  • Sentiment Analysis: Analyzing customer sentiment and improving customer experience based on call center interactions.
  • Generative AI: Training generative AI models capable of generating human-like responses, summaries, or content tailored to the BFSI domain.
  • Secure and Ethical Collection

  • Our proprietary data collection and transcription platform, “Yugo” was used throughout the process of this dataset creation.
  • Throughout the data collection process, the data remained within our secure platform and did not leave our environment, ensuring data security and confidentiality.
  • The data collection process adhered to strict ethical guidelines, ensuring the privacy and consent of all participants.
  • It does not include any personally identifiable information about any participant, which makes the dataset safe to use.
  • The dataset does not contain any copyrighted content.
  • Updates and Customization

    Understanding the importance of diverse environments for robust ASR models, our call center voice dataset is regularly updated with new audio data captured in various real-world conditions.

  • Customization & Custom Collection Options:
  • Environmental Conditions: Custom collection in specific environmental conditions upon request.
  • Sample Rates: Customizable from 8kHz to 48kHz.
  • Transcription Customization: Tailored to specific guidelines and requirements.
  • License

    This BFSI domain call center audio dataset is created by FutureBeeAI and is available for commercial use.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Card Head Line
    00:00

    ATTRIBUTES

    CHANNEL 1CHANNEL 2FORMAT

    TRANSCRIPTION

    LABEL
    START
    END
    CHANNEL
    TRANSCRIPT
    Speech
    0.299
    1.845
    85629874
    Hallo Future Bee.
    Speech
    1.971
    3.126
    61638683
    Hallo Future Bee.
    Speech
    5.931
    13.747
    85629874
    Einen wunderschönen guten tag. Sie sprechen mit Michaela Caniva von der (()) Reichbank. Wie kann ich ihnen helfen?
    Speech
    15.356
    18.908
    61638683
    Ihnen auch einen schönen guten tag. Hallo mein name ist Steininger.
    Speech
    19.425
    25.103
    61638683
    Und ich hätte gerne information zu eine debit karte die würde ich gerne beantagen
    Speech
    26.442
    32.661
    85629874
    Ja Herr Steininger. Gerne, sie haben bei, von uns keine debit karte?
    Speech
    33.816
    35.873
    61638683
    Nein, ich (()) mit meine konto beginnen.
    Speech
    35.965
    44.764
    85629874
    #Ah wunderbar. Möchten sie mir bitte ihre konto, #Ah konto informationen geben dazu brauche ich einaml die konto nummer und ihre geburtsdatum.
    Speech
    46.454
    47.333
    61638683
    Sehr gerne.
    Speech
    47.868
    50.638
    61638683
    Also das ist die <PII>neunachtsieben</PII>
    Speech
    51.569
    52.908
    85629874
    <PII>neunachtsieben</PII>
    Speech
    53.494
    54.868
    61638683
    <PII>sechsfünfvier</PII>
    Speech
    55.379
    56.862
    85629874
    <PII>sechsfünfvier</PII>
    Speech
    58.299
    59.730
    61638683
    <PII>dreizweieinsnull</PII>
    Speech
    60.701
    68.816
    85629874
    <PII>dreizweieinsnull</PII> wunderbar und ihre geburtsdatum zur personen verifizierung bräuchte ich noch.
    Speech
    70.431
    71.868
    61638683
    Der vierzente Februar
    Speech
    72.339
    73.994
    61638683
    neunzehnhundert siebenundfünfzig.
    Speech
    74.753
    81.333
    85629874
    Vierzehnte Februar. Ja woll, danke schön. Ihre geburtsort Hanover, ist er richtig?
    Speech
    82.557
    92.408
    85629874
    Ja, ja wunderbar. Dann habe ich sie nun gefunden. Und sie möchten eine debit karte bei uns bestellen oder möchten sie zu erst informationen dazu erhalten?
    Speech
    82.902
    83.460
    61638683
    Ja genau.
    Speech
    94.454
    96.540
    61638683
    #Ah erste mal informationen dazu bitte.
    Speech
    96.528
    100.919
    85629874
    Ja haben sie den erfahrung mit kredit karten nutzung?
    Speech
    102.494
    103.822
    61638683
    Bis jetzt nicht.
    Speech
    105.511
    111.546
    85629874
    Bisher keine erfahrung mit der kredit karten. Wozu möchten sie den gerne die debit karte nutzen?
    Speech
    113.149
    117.908
    61638683
    #am austäglich #Ah als, als zahlungsmittel beim online shopping.
    Speech
    118.661
    123.994
    61638683
    Und dann eventuell wenn das ohne probleme möglich ich, auch start der regulären karten zahlung.
    Speech
    119.707
    120.396
    85629874
    #Hmm #Mmm
    Speech
    125.488
    129.178
    85629874
    #Ah ja wunderbar. Sie meinen die (()) karte ja?
    Speech
    129.275
    130.138
    61638683
    Ja genau.
    Speech
    130.638
    139.120
    85629874
    Genau das sie stattdesen die debit karte nutzen. Das ist eine gute idee. Wissen sie den was der unterschied zwischen eine kredit karte und eine debit karte ist?
    Speech
    140.620
    144.787
    61638683
    Nicht genau. Vielleicht konnen sie mir dazu (()) informationen geben?
    Speech
    142.247
    142.810
    85629874
    #Hmm
    Speech
    145.379
    159.017
    85629874
    Ja gerne. Ich finde eine debit karte ist in solchen fällen sehr (()) denn hier können sie nicht in minus zuruckschrim. Eine debit karte könnten nur soll eine verwendet werden wie eine konto auch gedeckt ist.
    Speech
    159.063
    167.816
    85629874
    Somit haben sie keine fine das sie einmal in, in das minus (()) bei eine konto nutzung mit der debit karte.
    Speech
    169.528
    170.367
    85629874
    Sie verstehen mich?
    Speech
    170.281
    170.988
    61638683
    #Ah ja gucken.
    Speech
    171.494
    171.908
    61638683
    Ja.
    Speech
    172.390
    175.850
    61638683
    #am wie ist das in beim eine kredit karte? Was ist denn eine unterschied?
    Speech
    176.511
    184.545
    85629874
    Ja bei eine kredit karte, da können sie auch mir geld als geben wie ihnen so zu sagen auf dem konto zur verfügung steht.
    Speech
    184.945
    199.278
    85629874
    Das passiert leider wenn man den überblick einbisschen verloren hat bei den einkäufen und dann rückschlag schnelle man ins minus und die debit karte wie sagt hier nein, #Ah es geht nicht mehr das limit ist er heißt.
    Speech
    199.229
    205.091
    85629874
    Das ist natürlich viel praktischer auch beim online kaufs so wie auch bei der nutzung.
    Speech
    207.815
    210.718
    61638683
    #Ah ja alles klar gut. Dann weiß ich jetzt bescheid. Vielen dank.
    Speech
    210.976
    211.361
    85629874
    (())
    Speech
    211.459
    217.752
    61638683
    #am was für die denn bei eine transaktion mit eine debit karte gebühren am fallen?
    Speech
    218.597
    231.867
    85629874
    Ja. Die gebühren (()) ich sich auf circa drei prozent. Das ist viel normalle (()) bei nutzung von die debit karte wie auch von kredit karte.
    Speech
    231.913
    234.861
    85629874
    Oder anderen zahlungs möglichkeiten.
    Speech
    237.333
    238.338
    61638683
    #Ah ja wunderbar.
    Speech
    239.465
    240.695
    61638683
    Vielen dank #am
    Speech
    241.315
    248.471
    61638683
    Gibt es den fur mich wenn ich jetzt eine debit karte (()) beantrage fallen bei irgendwie kosten für mich an. (()) austellung der karte oder?
    Speech
    249.028
    250.620
    61638683
    Irgendwelchen nutzung gebühren für mich.
    Speech
    251.672
    264.177
    85629874
    #Ah ja das eine sehr gute frage Herr Steininger. Eine einmalige (()) gebühr fallt an bei der beantragung von der karte. Dieses ist ja ein jahr lang gültig und im
    Speech
    265.126
    275.603
    85629874
    im anschluss nach diesem jahr wird ihnen einen neue karte zugeschickt, auch hier fall einmalige gebühren an von sieben euro fünfundachtzig momentan.
    Speech
    276.218
    286.718
    85629874
    Dann haben wir eine monatliche nutzungs gebühren. Die wie läuft sich auf drei euro fünfundzwanzig. Also sie sehen sehr geringe kosten.
    Speech
    290.016
    292.746
    61638683
    Alles klar. Ja das hält sich in (()) kosten. Das geht.
    Speech
    293.603
    294.585
    61638683
    Gut dann
    Speech
    295.126
    298.137
    61638683
    denke ich habe ich alle meine fragen beantwortet bekommen.
    Speech
    298.965
    302.614
    61638683
    Und würde ich gerne eine beantragen. Wie gehe ich dann heir vor.
    Speech
    303.614
    314.597
    85629874
    #Oh das freut mich sehr das ich ihnen hier behilflich sein konnte. Da ich sie nun (()) gefunden habe in uns system soll es kein problem sein. Ich werde ihnen
    Speech
    314.700
    324.177
    85629874
    die informationen zu kommen lassen per Email und per post. Die fühlt sie bitte einmal aus dann dort sehen sie auch nochmal alle informationen dich in bereits
    Speech
    324.551
    338.390
    85629874
    In, in und uns telefon mitgeteilt haben. Und (()) dann dieses formular an und zurück ihnen wird eine debit karte ausgestellt und sie willkommen auch auf dem post alles (()) die karte zu gestellt.
    Speech
    340.890
    341.493
    61638683
    Wunderbar.
    Speech
    342.010
    343.740
    61638683
    Vielen dank für diese schnelle erledigung.
    Speech
    344.045
    344.999
    85629874
    Gerne.
    Speech
    344.436
    347.763
    61638683
    Und ich bedanke für das gespräch und wünsche ihnen einen schönen tag.
    Speech
    348.648
    357.223
    85629874
    Vielen dank sie darf ich sich gerne jederzeit an uns wenden. Auch ich wünschen ihnen einen wunderschönen guten tag. Auf wiederhören.
    Speech
    358.177
    358.878
    61638683
    Auf wiederhören.

    Dataset Details

    Card Head Line

    Language

    German

    Language code

    de

    Country

    Germany

    Accents

    Berlin, Brandenburg ...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70

    File Details

    Card Head Line

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo

    Audio file duration

    5-15 minutes

    Need datasets for a specific AI/ML use case?
    Don't worry, we've got you covered! 👍

    Contact Us
    Prompt 2 Bg