French (France) Call Center Speech Dataset for Travel

The audio dataset comprises call center conversations for the Travel domain, featuring native French speakers from France. It includes speech data, detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

Jun 2024

Number of participants

60

AI audio dataset for Travel in English (UK)
Download
Download Icon

About this Off-the-shelf Speech Dataset

Card Head Line

Introduction

Welcome to the French Call Center Speech Dataset for the Travel domain designed to enhance the development of call center speech recognition models specifically for the Travel industry. This dataset is meticulously curated to support advanced speech recognition, natural language processing, conversational AI, and generative voice AI algorithms.

Speech Data:

This training dataset comprises 30 Hours of call center audio recordings covering various topics and scenarios related to the Travel domain, designed to build robust and accurate customer service speech technology.

  • Participant Diversity:
  • Speakers: 60 expert native French speakers from the FutureBeeAI Community.
  • Regions: Different states/provinces of France, ensuring a balanced representation of French accents, dialects, and demographics.
  • Participant Profile: Participants range from 18 to 70 years old, representing both males and females in a 60:40 ratio, respectively.
  • Recording Details:
  • Conversation Nature: Unscripted and spontaneous conversations between call center agents and customers.
  • Call Duration: Average duration of 5 to 15 minutes per call.
  • Formats: WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 and 16 kHz.
  • Environment: Without background noise and without echo.
  • Topic Diversity

    This dataset offers a diverse range of conversation topics, call types, and outcomes, including both inbound and outbound calls with positive, neutral, and negative outcomes.

  • Inbound Calls:
  • Booking inquiries and assistance
  • Destination information and recommendations
  • Assistance with flight delays or cancellations
  • Special assistance for passengers with disabilities
  • Travel-related health and safety inquiry
  • Assistance with lost or delayed baggage, and many more
  • Outbound Calls:
  • Promotional offers and package deals
  • Customer satisfaction surveys
  • Booking confirmations and updates
  • Flight schedule changes and notifications
  • Customer feedback collection
  • Reminders for passport or visa expiration date, and many more
  • This extensive coverage ensures the dataset includes realistic call center scenarios, which is essential for developing effective customer support speech recognition models.

    Transcription

    To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. These transcriptions feature:

  • Speaker-wise Segmentation: Time-coded segments for both agents and customers.
  • Non-Speech Labels: Tags and labels for non-speech elements.
  • Word Error Rate: Word error rate is less than 5% thanks to the dual layer of QA.
  • These ready-to-use transcriptions accelerate the development of the Travel domain call center conversational AI and ASR models for the French language.

    Metadata

    The dataset provides comprehensive metadata for each conversation and participant:

  • Participant Metadata: Unique identifier, age, gender, country, state, district, accent and dialect.
  • Conversation Metadata: Domain, topic, call type, outcome/sentiment, bit depth, and sample rate.
  • This metadata is a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of French call center speech recognition models.

    Usage and Applications

    This dataset can be used for various applications in the fields of speech recognition, natural language processing, and conversational AI, specifically tailored to the Travel domain. Potential use cases include:

  • Speech Recognition Models: Training and fine-tuning speech recognition models for French.
  • Speech Analytics Models: Building speech analytics models to extract insights, identify patterns, and glean valuable information from customer conversation, enables data-driven decision-making and process optimization within the Travel sector.
  • Smart Assistants and Chatbots: Developing conversational agents and virtual assistants for customer service in the Travel industries.
  • Sentiment Analysis: Analyzing customer sentiment and improving customer experience based on call center interactions.
  • Generative AI: Training generative AI models capable of generating human-like responses, summaries, or content tailored to the Travel domain.
  • Secure and Ethical Collection

  • Our proprietary data collection and transcription platform, “Yugo” was used throughout the process of this dataset creation.
  • Throughout the data collection process, the data remained within our secure platform and did not leave our environment, ensuring data security and confidentiality.
  • The data collection process adhered to strict ethical guidelines, ensuring the privacy and consent of all participants.
  • It does not include any personally identifiable information about any participant, which makes the dataset safe to use.
  • The dataset does not contain any copyrighted content.
  • Updates and Customization

    Understanding the importance of diverse environments for robust ASR models, our call center voice dataset is regularly updated with new audio data captured in various real-world conditions.

  • Customization & Custom Collection Options:
  • Environmental Conditions: Custom collection in specific environmental conditions upon request.
  • Sample Rates: Customizable from 8kHz to 48kHz.
  • Transcription Customization: Tailored to specific guidelines and requirements.
  • License

    This Travel domain call center audio dataset is created by FutureBeeAI and is available for commercial use.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Card Head Line
    00:00

    ATTRIBUTES

    TRANSCRIPTION

    TIME
    TRANSCRIPT
    1.823 - 2.915
    Hey futurebee
    4.000 - 5.088
    Hey futurebee
    8.493 - 10.406
    Alexia Travel, Bonjour.
    11.348 - 11.784
    -
    11.909 - 20.452
    Oui bonjour madame, je vous appelle parce que j'ai vu passer sur votre page Facebook que vous organiser des voyages pour Madagascar
    20.475 - 20.951
    -
    21.032 - 24.164
    #Amm Est-ce que ce serait possible d'avoir plus d'informations s'il vous plaît ?
    21.047 - 21.425
    [noise]
    24.960 - 29.399
    Oui, bien sûr, il s'agit d'un voyage de deux semaines
    30.030 - 31.294
    À Madagascar.
    31.754 - 44.106
    #Amm peu importe où trouver [filler] le voyage, inclut le, le transport de, de, votre, votre lieu de départ jusqu'à Madagascar
    44.140 - 44.396
    -
    44.508 - 47.561
    Il s'agit comme je l'ai dit dans voyage de deux semaines.
    48.045 - 54.457
    Et #Amm ce serait une occasion pour connaître le pays et faire un peu de tourisme
    56.271 - 70.450
    D'accord, très bien #Amm quand vous dites que #Amm vous organisez le transport du pays d'origine à Madagascar, alors en fait déjà moi je pars de Paris de France
    66.652 - 67.055
    oui
    69.909 - 70.444
    D'accord
    70.403 - 70.900
    -
    70.921 - 71.236
    oui
    71.236 - 75.793
    Et #Amm est-ce que vous prenez aussi en charge le retour de Madagascar vers Paris ?
    76.361 - 85.319
    Oui bien sûr c'est compris dans le prix à ce sujet j'aimerais vous informer que pour une personne ce sera de (()) quatre-mille euros
    85.936 - 86.125
    -
    86.197 - 94.593
    #Amm donc #Amm comme je vous l'ai dit, l'aller, et le retour #Amm est pris en charge dans
    95.102 - 95.944
    dans le tarif.
    96.792 - 97.322
    -
    97.671 - 109.230
    D'accord très bien. #Amm Est-ce que vous pourriez me détailler un petit peu quels sont les services inclus dans ces dans ce service de quatre-mille euros ? Quelles sont les destinations ?
    109.230 - 109.637
    -
    109.632 - 110.319
    D'accord
    110.114 - 110.674
    Par exemple
    111.250 - 118.283
    Oui alors #Amm nous sommes une agence de voyage et nous proposons deux circuits en ce qui concerne Madagascar.
    118.950 - 119.233
    #Mmm
    118.965 - 125.117
    Alors le premier circuit vous, vous, la destination, vous serez emmener
    125.745 - 133.104
    #Amm à Nosy Be ensuite à (()), (()) et enfin Antananarive, pour le premier circuit
    133.366 - 133.717
    -
    133.800 - 135.711
    Ensuite, pour le deuxième circuit
    136.275 - 139.050
    #Amm la première ville à visiter, c'est Nossy Be
    139.663 - 140.633
    (())
    141.044 - 143.627
    #Amm (()) et Antananarive
    144.110 - 149.596
    Il s'agit de noter que toutes ces destinations sont des, sont des destinations touristiques
    150.306 - 152.610
    Ils sont très prisées par les touristes
    153.122 - 160.900
    En ce qui concerne en Antananarive, il s'agit de la ville de départ, la ville de départ pour le retour vers le pays d'origine.
    161.151 - 161.389
    -
    161.485 - 166.258
    Il faut que ce soit #Amm la dernière destination avant le départ
    166.341 - 166.625
    -
    166.691 - 171.211
    Vu que l'aéroport international est à Antananarive
    172.235 - 181.723
    Ensuite, #Amm ça sera aussi l'occasion de visiter un peu la capitale, puisque en Antananarive est la capitale de Madagascar
    178.038 - 178.180
    [noise]
    183.145 - 183.502
    -
    183.812 - 196.538
    D'accord très bien #Amm , donc si j'ai bien compris il y a un aéroport international à Nocibé #Amm (()) vers lequel on va atterrir c'est bien ça ?
    185.276 - 185.584
    oui
    196.383 - 207.532
    Oui, oui il y a un un aéroport international à Nosy Be, nous nous chargeront de tout les, toutes les, toutes les, procédures administratives
    207.592 - 207.949
    -
    208.026 - 210.347
    #Amm si vous partez de Paris
    208.030 - 209.709
    [noise]
    210.810 - 219.888
    #Amm il y a un service qui permet de, de directement aller sur Nosy Be
    218.209 - 218.341
    [noise]
    220.341 - 223.221
    et cela est inclus dans le prix que je vous avais dit tout à l'heure
    224.197 - 224.518
    -
    224.836 - 237.074
    D'accord, très bien. #Amm Il m'a semblé que vous aviez des dates précises, on ne peut pas choisir les dates de de voyage c'est bien ça ?
    237.246 - 237.411
    -
    237.674 - 240.330
    Oui alors #Amm , en ce qui concerne les dates
    240.818 - 246.598
    #Amm il faut savoir qu'il s'agit d'un voyage organisé en groupe
    246.776 - 247.633
    -
    247.449 - 254.228
    #Amm pour le moment, on accueillons que dix personnes par groupe en voyage
    247.895 - 248.250
    D'accord
    254.258 - 254.592
    -
    254.675 - 259.110
    Et pour accommoder toutes les personnes à à ces dates
    255.377 - 255.715
    #Mmm
    259.151 - 259.456
    -
    259.509 - 269.435
    #Amm il fallait que ce soit nous qui décidions à l'avance quelles seront les dates de voyage. En ce qui concerne le premier, le prochain voyage
    266.588 - 267.021
    #Mmm
    269.846 - 274.365
    #Amm ce sera du onze juillet au vingt-cinq juillet prochain
    270.463 - 270.644
    [noise]
    276.245 - 276.427
    -
    276.670 - 280.567
    D'accord très bien, donc c'est en plein été ça va être parfait
    279.365 - 279.814
    -
    280.653 - 281.596
    -
    281.887 - 285.571
    Au fait, il faut savoir aussi que le climat à Madagascar
    286.040 - 289.382
    T'es pas comme celui de de l'hémisphère nord
    289.970 - 304.197
    Il ne fait pas très chaud et pas très froid. Donc en été, il ne fait pas très chaud et en hiver il ne fait pas très froid donc le onze et le vingt-cinq juillet
    290.718 - 291.468
    #Amm
    304.661 - 309.983
    Ce sera entre l'hiver et le printemps
    311.298 - 317.064
    Donc ce sera vraiment un (()) des températures modérées
    318.732 - 320.629
    Ce n'est pas comme dans le nord
    319.002 - 319.298
    [noise]
    322.213 - 333.180
    D'accord, très bien, effectivement il fallait le prendre en compte parce que je je, suis un petit peu décalé, étant donné je viens de l'hémisphère nord merci pour ces informations
    326.254 - 326.685
    oui
    330.834 - 331.290
    oui
    333.307 - 333.966
    -
    333.677 - 334.608
    Je vous en prie
    335.379 - 335.701
    -
    335.735 - 339.197
    #Amm du coup j'aurai quelques questions quand même s'il vous plaît
    339.625 - 340.057
    oui
    339.958 - 340.278
    -
    340.302 - 341.011
    #Amm
    340.997 - 342.156
    -
    342.201 - 356.898
    #Amm déjà par rapport aux déplacements, par exemple de (()) à (()) de (()) à (()) et de (()) à Antananarive est-ce que ce sera des, des, déplacements en avion en voiture ou en bateau peut-être je ne sais pas
    347.137 - 347.487
    oui
    349.848 - 350.120
    oui
    355.153 - 355.437
    [noise]
    357.093 - 357.550
    -
    357.456 - 359.221
    D'accord alors #Amm
    359.810 - 363.442
    #Amm de (()) à (())
    364.576 - 364.750
    -
    364.975 - 366.338
    il faudra
    366.730 - 369.228
    passer par avion part Antananarive.
    369.559 - 369.797
    -
    369.858 - 374.884
    Et ensuite de Antananarive à (()), ça sera un voyage sur route.
    375.283 - 375.386
    -
    375.596 - 380.372
    De même que pour (()) à (()), ça sera en voyage sur route
    380.439 - 380.970
    [noise]
    381.011 - 386.019
    Ça prendra de Antananarive à (()) ça prendra trois heures à peu près
    381.665 - 382.098
    #Mmm
    386.389 - 386.814
    -
    386.834 - 391.706
    Je suis de (())à (()) ça prendra six heures à peu près je dirais
    392.500 - 392.973
    D'accord
    392.850 - 398.024
    Et ensuite de (()) à Antananarive, ça prendra à peu près dix heures
    399.656 - 399.982
    -
    400.728 - 406.766
    D'accord, très bien, c'est c'est parfait #Amm
    401.836 - 402.355
    oui
    405.653 - 410.824
    C'est pour le premier circuit, est-ce que vous souhaitez savoir pour le deuxième circuit ?
    408.709 - 409.067
    #Hmm
    411.507 - 418.144
    #Ah oui bien sûr j'avais oublié qu'il y avait un deuxième circuit oui je veux bien avoir les informations s'il vous plaît
    416.560 - 416.992
    oui
    418.737 - 426.826
    Sur le deuxième circuit de Nocibé à (()), il y a un vol aérien (()) il faut y aller par avion.
    426.980 - 427.281
    -
    427.317 - 430.141
    Ensuite, de (())à (())
    427.646 - 428.021
    #Mmm
    430.701 - 434.788
    #Amm c'est tout près, ça prendra trois heures sur route
    435.298 - 443.927
    Et ensuite de (()) à (()) il faudra passer par (()) pour prendre l'avion faire (())
    435.637 - 436.031
    #Mmm
    444.966 - 445.257
    -
    445.550 - 458.298
    #Mmm d'accord, donc pour ce deuxième circuit, il y aura moins de voyage sur route #Amm donc j'imagine que ce sera plus, les déplacements seront un petit peu plus rapides que sur le premier circuit
    446.737 - 447.161
    oui
    450.706 - 451.673
    Sur route, oui
    457.084 - 457.504
    oui
    458.312 - 458.925
    -
    458.641 - 459.307
    Voilà
    459.192 - 459.966
    et #Amm
    460.754 - 471.608
    Et je vous avoue que je me pose des questions quand même par rapport au, au déplacement sur route comment, comment est la sécurité sur les routes de Madagascar, est-ce que vous avez des informations là-dessus ?
    465.920 - 466.290
    oui
    472.701 - 478.723
    Pour #Amm pour l'instant, nous n'avons jamais eu d'accidents par rapport aux voyages sur route
    478.915 - 479.386
    -
    479.435 - 484.199
    #Amm ces ces voyages sur route se déroulent
    479.526 - 479.867
    D'accord
    484.944 - 493.122
    En #Amm en caravane, c'est-à-dire pour les dix personnes qui qui voyagent
    488.841 - 489.298
    #Mmm
    493.603 - 500.540
    Vous aurez droit à #Ah cinq voitures, cinq voitures pour deux personnes
    501.242 - 507.386
    Cinq voitures pour deux personnes par voyage, c'est-à-dire qu'il y aura
    507.326 - 507.752
    -
    507.899 - 509.410
    Cinq quatre,quattre
    509.677 - 509.809
    -
    509.970 - 516.254
    Qui feront une caravane, et nous nous déplaçons nous nous déplaçons uniquement
    510.334 - 510.725
    #Amm
    516.961 - 517.721
    le jour
    518.628 - 518.721
    -
    518.797 - 520.801
    donc en ce qui concerne la sécurité
    520.822 - 521.225
    -
    521.274 - 525.245
    c'est ça a été renforcé, et nous n'avions jamais eu d'incident par rapport à cela
    525.980 - 527.177
    Vous pouvez être rassurée
    526.225 - 527.192
    D'accord
    527.730 - 528.192
    oui
    528.215 - 533.244
    D'accord excellence, c'est très bon à savoir (()) justement par rapport à
    531.388 - 531.663
    oui
    533.692 - 539.791
    Par rapport à finalement ces déplacements en quatre, quatre étant donné que je prévois de me déplacer avec ma sœur
    536.667 - 537.038
    oui
    539.764 - 540.157
    -
    540.118 - 540.484
    oui
    540.200 - 545.576
    #Amm j'imagine que dans ce cas là, on aura le droit un quatre, quatre toutes les deux
    545.774 - 546.480
    [noise]
    546.038 - 546.966
    Oui c'est ça
    547.912 - 560.460
    #Amm est-ce qu'il y a des possibilités de, de faire les déplacements en dehors du groupe, c'est-à-dire d'aller faire les visites, un petit peu en mode indépendant
    560.913 - 561.620
    toutes les deux
    562.219 - 570.423
    Alors les charges qui nous sont qui qui incombe à ce, à ce (())voyage
    566.316 - 567.432
    -
    570.960 - 575.128
    On les a calculées, et #Amm #Amm
    575.620 - 578.322
    C'est prévu pour les dix personnes ensembles
    577.572 - 579.605
    [noise] #Amm
    578.528 - 578.743
    -
    578.783 - 587.158
    Par contre, si vous voulez faire du tourisme, à part nous nous, nous nous chargeront de vous mettre à disposition
    580.144 - 581.783
    [noise]
    587.908 - 588.017
    -
    588.110 - 589.057
    d'une voiture
    589.027 - 589.422
    -
    589.706 - 592.019
    un chauffeur est un guide
    591.118 - 591.245
    -
    592.639 - 595.143
    Pour sept euros par jour
    596.748 - 596.884
    [noise]
    596.985 - 597.336
    #Mmm
    597.240 - 600.739
    #Amm le carburant est en (())
    601.548 - 607.427
    donc vous aurez à disposition la voiture, le guide #Amm et le chauffeur.
    602.072 - 602.524
    (())
    609.692 - 617.000
    D'accord, très bien, donc il faudra prévoir en plus si on veut se déplacer à part
    610.927 - 611.330
    oui
    616.350 - 616.826
    Voilà
    617.538 - 617.947
    #Mmm
    618.620 - 627.168
    Par rapport par rapport aux hébergements est-ce que on sera logées dans des hôtels ou dans des maisons d'hôtes
    627.644 - 627.774
    -
    628.225 - 632.427
    Alors, pour pour les hébergements
    631.326 - 631.649
    -
    632.863 - 636.591
    Pour si vous choisissez le premier circuit
    636.990 - 637.282
    -
    637.504 - 648.985
    Nosy Be, à Nosy Be vous serez logés dans un hôtel. Je ne sais pas si vous connaissez (()) Beach. Je serez logés dans cette hôtel
    637.649 - 637.899
    #Mmm
    646.278 - 646.447
    -
    649.383 - 658.625
    Pour (()) aussi, ce sera un hôtel par compte pour (()), ça sera obligatoirement une chambre d'hôtes.
    659.052 - 662.533
    Et pour en Antananarive, ce sera un hôtel.
    659.658 - 660.143
    #Hmm
    663.498 - 663.649
    [noise]
    663.759 - 665.138
    Pour le deuxième circuit
    665.671 - 670.235
    Nosy be ce sera un hôtel comme pour le premier circuit
    670.671 - 672.884
    (()) ce sera un hôtel
    673.494 - 677.687
    (()) ce sera une chambre d'hôtes, et Antananarive un hôtel
    678.902 - 679.105
    [noise]
    679.498 - 683.791
    D'accord très bien et par rapport au repas comment ça va se passer ?
    684.815 - 687.375
    #Amm normalement
    688.124 - 690.312
    En ce qui concerne le premier circuit
    691.245 - 691.336
    -
    691.730 - 691.923
    tous
    692.546 - 698.149
    Tous les repas sont pris en charge par l'agence de voyage
    698.743 - 708.455
    Sauf si #Amm vous décidez de faire #Amm un circuit, à part, si vous décidez de faire du tourisme à part
    699.056 - 699.389
    D'accord
    708.566 - 709.067
    -
    709.230 - 714.171
    Donc le petit déjeuner le déjeuner, le dîner sont inclus dans le prix
    714.307 - 714.465
    -
    714.567 - 718.086
    De même de même que pour le deuxième circuit
    720.095 - 720.638
    D'accord
    721.317 - 722.788
    Très bien, c'est
    722.778 - 723.177
    -
    723.230 - 724.826
    C'est excellent
    724.793 - 725.134
    -
    725.326 - 726.062
    #Amm
    726.274 - 726.403
    -
    726.488 - 741.455
    Est-ce est-ce que vous pourriez #Amm décrire un petit peu le, (()) le contenu des circuits s'il vous plaît par exemple qu'est-ce qu'il y a à, qu'est-ce qu'on pourrait visiter à (()), (()) et Antananarive pour le premier ?
    734.778 - 734.998
    [noise]
    741.504 - 745.028
    Et peut-être à (()) et à (()) pour le deuxième
    745.528 - 747.461
    Oui bien sûr, c'est avec plaisir
    747.488 - 747.817
    -
    747.985 - 748.875
    #Amm
    750.268 - 753.046
    Pour Nocy Be, il s'agit d'une ville touristique
    753.971 - 756.144
    Ce sont les plages paradisiaques
    756.984 - 766.749
    Le, l' hotel de (()) Beach en lui-même est un hôtel réputé pour sa beauté et son service
    756.990 - 757.239
    #Mmm
    761.840 - 761.980
    [noise]
    767.673 - 773.423
    Dans dans dans toutes les villes touristiques du monde
    767.716 - 768.163
    #Mmm
    774.355 - 774.504
    -
    774.875 - 777.629
    Pour (()) vous pourriez voir les
    778.110 - 780.589
    Les espèces endémiques de Madagascar
    780.980 - 783.099
    Vous pourriez voir des lémuriens
    783.552 - 785.168
    des des

    Dataset Details

    Card Head Line

    Language

    French

    Language code

    fr

    Country

    France

    Accents

    Français méridional, Français d'Alsace ...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70

    File Details

    Card Head Line

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo

    Audio file duration

    5-15 minutes

    Need datasets for a specific AI/ML use case?
    Don't worry, we've got you covered! 👍

    Contact Us
    Prompt 2 Bg