Gujarati Call Center Speech Dataset for Real Estate

This Gujarati speech dataset features real-world call center conversations from the Real Estate domain. With detailed metadata and accurate transcriptions, it’s designed to power ASR systems, voice AI, and conversational agents.

Category

Unscripted Call Center Conversations

Total Volume

30 Speech Hours

Last updated

June 2025

Number of participants

60

Speech training dataset for Realestate in Gujarati (India)
Download
Download Icon

About this Off-the-shelf Speech Dataset

Card Head Line

Introduction

This Gujarati Call Center Speech Dataset for the Real Estate industry is purpose-built to accelerate the development of speech recognition, spoken language understanding, and conversational AI systems tailored for Gujarati -speaking Real Estate customers. With over 30 hours of unscripted, real-world audio, this dataset captures authentic conversations between customers and real estate agents ideal for building robust ASR models.

Curated by FutureBeeAI, this dataset equips voice AI developers, real estate tech platforms, and NLP researchers with the data needed to create high-accuracy, production-ready models for property-focused use cases.

Speech Data

The dataset features 30 hours of dual-channel call center recordings between native Gujarati speakers. Captured in realistic real estate consultation and support contexts, these conversations span a wide array of property-related topics from inquiries to investment advice offering deep domain coverage for AI model development.

  • Participant Diversity:
  • Speakers: 60 native Gujarati speakers from our verified contributor community.
  • Regions: Representing different regions across Gujarat to ensure accent and dialect variation.
  • Participant Profile: Balanced gender mix (60% male, 40% female) and age range from 18 to 70.
  • Recording Details:
  • Conversation Nature: Naturally flowing, unscripted agent-customer discussions.
  • Call Duration: Average 5–15 minutes per call.
  • Audio Format: Stereo WAV, 16-bit, recorded at 8kHz and 16kHz.
  • Recording Environment: Captured in noise-free and echo-free conditions.
  • Topic Diversity

    This speech corpus includes both inbound and outbound calls, featuring positive, neutral, and negative outcomes across a wide range of real estate scenarios.

  • Inbound Calls:
  • Property Inquiries
  • Rental Availability
  • Renovation Consultation
  • Property Features & Amenities
  • Investment Property Evaluation
  • Ownership History & Legal Info, and more
  • Outbound Calls:
  • New Listing Notifications
  • Post-Purchase Follow-ups
  • Property Recommendations
  • Value Updates
  • Customer Satisfaction Surveys, and others
  • Such domain-rich variety ensures model generalization across common real estate support conversations.

    Transcription

    All recordings are accompanied by precise, manually verified transcriptions in JSON format.

  • Transcription Includes:
  • Speaker-Segmented Dialogues
  • Time-coded Segments
  • Non-speech Tags (e.g., background noise, pauses)
  • High transcription accuracy with word error rate below 5% via dual-layer human review.
  • These transcriptions streamline ASR and NLP development for Gujarati real estate voice applications.

    Metadata

    Detailed metadata accompanies each participant and conversation:

  • Participant Metadata: ID, age, gender, location, accent, and dialect.
  • Conversation Metadata: Topic, call type, sentiment, sample rate, and technical details.
  • This enables smart filtering, dialect-focused model training, and structured dataset exploration.

    Usage and Applications

    This dataset is ideal for voice AI and NLP systems built for the real estate sector:

  • Automatic Speech Recognition (ASR): Train high-accuracy speech-to-text models in Gujarati.
  • Speech Analytics: Extract insights on buyer interest, investment intent, and property preferences.
  • Chatbots & Voice Assistants: Develop smart real estate virtual agents.
  • Sentiment Analysis: Detect urgency, uncertainty, or interest in property-related calls.
  • Generative AI: Fine-tune Gujarati language models for summarizing or responding to property inquiries.
  • Secure and Ethical Collection

  • Data collected via FutureBeeAI’s secure platform “Yugo” with strict ethical oversight.
  • No personally identifiable information is included.
  • Fully compliant with global data privacy standards and copyright-free.
  • Updates and Customization

    We continuously enhance this dataset with new recordings and offer full customization:

  • Customization Options:
  • Environment: Silent, noisy, or varied real-world conditions on request.
  • Sample Rate: Adjustable from 8kHz to 48kHz.
  • Transcription: Custom formats and QA guidelines available.
  • License

    This Real Estate domain dataset is commercially licensed and ready for use in your Gujarati ASR, NLP, and voice AI workflows.

    Use Cases

    Use of speech data in Conversational AI

    Call Center Conversational AI

    Use of speech data for Automatic Speech Recognition

    ASR

    Use of speech data for Chatbot & voicebot creation

    Chatbot

    Use of speech data in Language Modeling

    Language Modelling

    Use of speech data in Text-into-speech

    TTS

    Speech data usecase in Speech Analytics

    Speech Analytics

    Dataset Sample(s)

    Card Head Line

    ATTRIBUTES

    TRANSCRIPTION

    TIME
    TRANSCRIPT
    1.245 - 2.365
    <lang:Foreign>Hello FutureBee</lang:Foreign>
    1.505 - 2.745
    <lang:Foreign>Hello FutureBee</lang:Foreign>
    6.765 - 10.045
    <lang:Foreign>hello welcome! </lang:Foreign>કૃષ્ણમ <lang:Foreign>developers</lang:Foreign> માંથી <PII>સૌરભ</PII> વાત કરી રહ્યો છું શું <lang:Foreign>help</lang:Foreign> કરી શકું?
    10.345 - 11.365
    શું <lang:Foreign>help</lang:Foreign> કરી શકું?
    12.045 - 19.165
    <lang:Foreign>Hello,</lang:Foreign> હું <PII>જયેશ</PII> વાત કરી રહ્યો છું હું કૃષ્ણનમ <lang:Foreign>society</lang:Foreign> માં <lang:Foreign>two <initial>BHK</initial> flat</lang:Foreign> અથવાં તો <lang:Foreign>three <initial>BHK</initial> flat</lang:Foreign> લેવાનું વિચારતો હતો. તો મને થોડી <lang:Foreign>details</lang:Foreign> જોઈતી હતી.
    19.825 - 22.345
    તો મને થોડી <lang:Foreign>details</lang:Foreign> જોઈતી હતી.
    27.365 - 31.105
    <lang:Foreign>okay</lang:Foreign> બરોબર, તમારું <lang:Foreign>budget</lang:Foreign> અને <lang:Foreign>location</lang:Foreign> તમારે કઈ રીતનું જોઈએ છે?
    31.885 - 39.125
    મારુ <lang:Foreign>budget approx</lang:Foreign> ચાલીસ થી સાઈઠ લાખ રૂપિયાનું છે અને મારે <lang:Foreign>riverfront</lang:Foreign> નજીકમાં હું મારો એક મકાન ગોતી રહ્યો હતો.
    43.925 - 47.205
    ઓકે વાંધો નહીં. કૃષ્ણનમ <lang:Foreign>society</lang:Foreign> માં અત્યારે <lang:Foreign>two <initial>BHK</initial></lang:Foreign> નો. પીસ્તાલીસ લાખ આસપાસ ભાવ ચાલી રહેલ છે અને <lang:Foreign>three <initial>BHK</initial></lang:Foreign> અઠ્ઠાવન લાખ સુંધીમાં છે
    48.005 - 52.065
    પીસ્તાલીસ લાખ આસપાસ ભાવ ચાલી રહેલ છે અને <lang:Foreign>three <initial>BHK</initial></lang:Foreign> અઠ્ઠાવન લાખ સુંધીમાં છે
    54.145 - 58.425
    અચ્છા તો આપણે <lang:Foreign>society</lang:Foreign> શું શું <lang:Foreign>facility available</lang:Foreign> હશે?
    61.985 - 67.485
    <lang:Foreign>okay society</lang:Foreign> તો સારી છે. આમાં <lang:Foreign>club house</lang:Foreign> તમને મળશે. <lang:Foreign>garden area</lang:Foreign> છે, <lang:Foreign>children play area</lang:Foreign> અને <lang:Foreign>twenty four in to seven security</lang:Foreign> પણ છે તો એમાં કોઈ <lang:Foreign>issue</lang:Foreign> નહિ રહે.
    68.005 - 72.645
    અને <lang:Foreign>twenty four in to seven security</lang:Foreign> પણ છે તો એમાં કોઈ <lang:Foreign>issue</lang:Foreign> નહિ રહે.
    74.065 - 80.345
    અચ્છા એટલે <lang:Foreign>security</lang:Foreign> ને બધું તો છે, <lang:Foreign>but society</lang:Foreign> માં <lang:Foreign>parking</lang:Foreign> અને <lang:Foreign><initial>CCTV</initial></lang:Foreign> ની <lang:Foreign>facility available</lang:Foreign> છે કે પછી
    83.605 - 86.185
    હાં, <lang:Foreign>society</lang:Foreign> માં એક <lang:Foreign>basement parking</lang:Foreign> <lang:Foreign>per flat allot</lang:Foreign> કરવામાં આવે છે અને <lang:Foreign>full security coverage</lang:Foreign> છે અને <lang:Foreign>special visiting parking</lang:Foreign> પણ છે. તો કોઈ <lang:Foreign>visitor</lang:Foreign> આવે તો એના માટે અલગથી <lang:Foreign>parking</lang:Foreign> આપેલી.
    86.685 - 88.645
    <lang:Foreign>per flat allot</lang:Foreign> કરવામાં આવે છે અને
    89.085 - 95.645
    <lang:Foreign>full security coverage</lang:Foreign> છે અને <lang:Foreign>special visiting parking</lang:Foreign> પણ છે. તો કોઈ <lang:Foreign>visitor</lang:Foreign> આવે તો એના માટે અલગથી <lang:Foreign>parking</lang:Foreign> આપેલી.
    96.689 - 97.274
    -
    97.325 - 104.725
    અચ્છા, અને મારે આ <lang:Foreign>flat</lang:Foreign> લેવો હોય તો એના ઉપર <lang:Foreign>loan</lang:Foreign> કરવા માટે મને થોડુંક જણાવજો ને કઈ રીતનું શું <lang:Foreign>process</lang:Foreign> કરવી પડશે?
    107.349 - 110.485
    <lang:Foreign>okay loan</lang:Foreign> માટે તમે <lang:Foreign>business</lang:Foreign> કરો છો? કે ક્યાંય <lang:Foreign>job</lang:Foreign> કરો છો?
    111.465 - 113.145
    હું અત્યારે <lang:Foreign>job</lang:Foreign> કરું છું.
    116.205 - 121.345
    <lang:Foreign>okay ,</lang:Foreign> તો આપણા <lang:Foreign>loan partner</lang:Foreign> જોડેથી તમને એસી ટકા સુધીની <lang:Foreign>loan</lang:Foreign> મળી શકશે.
    121.703 - 121.988
    -
    122.627 - 122.897
    -
    123.065 - 129.785
    એસી ટકા સુધીની <lang:Foreign>loan</lang:Foreign> મળી શકશે તો એમાં આપણે <lang:Foreign><initial>EMI</initial></lang:Foreign> નું કેટલું આવશે? અને શું થશે? એનું. જરા મને જણાવજો ને.
    132.285 - 133.925
    <lang:Foreign>okay ,</lang:Foreign> તો <lang:Foreign>loan</lang:Foreign> માટે તમારે. <lang:Foreign>per annum</lang:Foreign> સાડા સાત <lang:Foreign>percent</lang:Foreign> નું <lang:Foreign>intrest</lang:Foreign> રહેશે. વીસ વર્ષની <lang:Foreign>loan</lang:Foreign> થઈ જશે. અને <lang:Foreign><initial>EMI</initial></lang:Foreign> તમારે <lang:Foreign>approx</lang:Foreign> પાત્રીસ હજાર આસપાસ <lang:Foreign>per month <initial>EMI</initial></lang:Foreign> આવશે.
    134.645 - 139.345
    <lang:Foreign>per annum</lang:Foreign> સાડા સાત <lang:Foreign>percent</lang:Foreign> નું <lang:Foreign>intrest</lang:Foreign> રહેશે. વીસ વર્ષની <lang:Foreign>loan</lang:Foreign> થઈ જશે.
    140.465 - 145.125
    અને <lang:Foreign><initial>EMI</initial></lang:Foreign> તમારે <lang:Foreign>approx</lang:Foreign> પાત્રીસ હજાર આસપાસ <lang:Foreign>per month <initial>EMI</initial></lang:Foreign> આવશે.
    146.585 - 148.245
    પાત્રીસ હજાર આસપાસ <lang:Foreign>per month</lang:Foreign> અને આપણે <lang:Foreign>down payment</lang:Foreign> આમાં કેટલુંક ભરવું પડશે?
    148.725 - 151.405
    અને આપણે <lang:Foreign>down payment</lang:Foreign> આમાં કેટલુંક ભરવું પડશે?
    154.425 - 159.025
    <lang:Foreign>down payment</lang:Foreign> તો જે. <lang:Foreign>flat</lang:Foreign> ની <lang:Foreign>price</lang:Foreign> હોય એના દસ વીસ ટકા <lang:Foreign>down payment</lang:Foreign> ભરવું પડે.
    159.965 - 163.205
    દસ વિસ ટકા જ ભરવાનું હોય <lang:Foreign>down payment</lang:Foreign> બાકી બધી <lang:Foreign>loan</lang:Foreign> માં આવી જાશે
    165.605 - 165.825
    હમ્
    165.685 - 168.785
    હા, લોન થશે એટલે થઈ જશે <lang:Foreign>loan salary slip</lang:Foreign> ઉપર
    169.885 - 174.485
    તો મારે <lang:Foreign>loan</lang:Foreign> કરાવવી હોય તેના માટે કયા કયા <lang:Foreign>documents</lang:Foreign> લાવવા પડશે?એ જરાક મને જણાવજોને.
    178.865 - 183.605
    <lang:Foreign>document</lang:Foreign> માં આધાર <lang:Foreign>card</lang:Foreign> જોઈશે, તમારો <lang:Foreign>job</lang:Foreign> કરતા હોય તો <lang:Foreign>salary slip</lang:Foreign> ત્રણ મહિના ની. <lang:Foreign>bank statement</lang:Foreign> જોઈશે છ મહિનાનું અને <lang:Foreign>income tax</lang:Foreign> ના <lang:Foreign>return</lang:Foreign> ભરેલા જોઈશે <lang:Foreign>last</lang:Foreign> બે વર્ષના.
    184.445 - 189.005
    <lang:Foreign>bank statement</lang:Foreign> જોઈશે છ મહિનાનું અને <lang:Foreign>income tax</lang:Foreign> ના <lang:Foreign>return</lang:Foreign> ભરેલા જોઈશે
    189.685 - 190.845
    <lang:Foreign>last</lang:Foreign> બે વર્ષના.
    192.565 - 194.865
    એટલે <lang:Foreign>income tax</lang:Foreign> ના <lang:Foreign>return last</lang:Foreign> બે વર્ષના.
    196.985 - 197.345
    હા.
    197.665 - 202.205
    અચ્છા, અને આપણે <lang:Foreign>flat registration</lang:Foreign> ની <lang:Foreign>process</lang:Foreign> કેવી રીતની હોય છે? એનું જરાક મને કહેજો.
    204.805 - 211.025
    <lang:Foreign>okay, loan</lang:Foreign> નું <lang:Foreign>approval</lang:Foreign> આવી જાય તો <lang:Foreign>registration</lang:Foreign> થઈ જશે. <lang:Foreign>stamp duty</lang:Foreign> અને <lang:Foreign>registration</lang:Foreign> ની <lang:Foreign>fee</lang:Foreign> રહેશે અઢી લાખ રૂપિયા જેવી. એ ભરવાની રહેશે.
    211.865 - 212.885
    એ ભરવાની રહેશે.
    214.085 - 216.405
    એટલે <lang:Foreign>flat registration fee</lang:Foreign> અઢી લાખ રૂપિયા?
    218.925 - 221.265
    હા દસ્તાવેજ ને <lang:Foreign>stamp duty</lang:Foreign> ના અઢી લાખ રૂપિયા થશે.
    221.945 - 222.545
    શક્ય.
    223.125 - 229.645
    તો અત્યારે કોઈ <lang:Foreign>discount</lang:Foreign> કે કોઈ એવી રીતમાં <lang:Foreign>available</lang:Foreign> હોય તો જરાક મને જણાવજો ને કે અમારે કઈ રીતના એમાંથી થોડું
    225.980 - 226.205
    -
    230.125 - 232.085
    <lang:Foreign>discount</lang:Foreign> મલતું હોય તો વધારે સારું રેય
    234.965 - 237.725
    <lang:Foreign>okay ,</lang:Foreign> જો તમે એક <lang:Foreign>week</lang:Foreign> માં <lang:Foreign>booking</lang:Foreign> કરાવો તો. દોઢ લાખ સુધીનું <lang:Foreign>discount builder</lang:Foreign> જોડેથી થઈ જશે તમારું.
    238.245 - 241.085
    દોઢ લાખ સુધીનું <lang:Foreign>discount builder</lang:Foreign> જોડેથી થઈ જશે તમારું.
    242.645 - 244.825
    એટલે <lang:Foreign>week</lang:Foreign> પહેલા <lang:Foreign>booking</lang:Foreign> કરાઈયે તો?
    246.845 - 251.525
    હાં એક <lang:Foreign>week</lang:Foreign> ની અંદર <lang:Foreign>booking</lang:Foreign> કરાવો છો તો <lang:Foreign>builder</lang:Foreign> જોડેથી દોઢ લાખ સુંધીનું <lang:Foreign>discount</lang:Foreign> કરાવી આપીશું
    252.425 - 256.305
    અને એમાં આપણે કોઈ <lang:Foreign>furnish</lang:Foreign> નો વિક <lang:Foreign>available</lang:Foreign> છે વિકલ્પ? કે પછી ખાલી એમ એમને એમ ખાલી ઘર જ આય જશે કોઈ <lang:Foreign>furniture</lang:Foreign> વગર.
    257.745 - 260.765
    ખાલી એમ એમને એમ ખાલી ઘર જ આય જશે કોઈ <lang:Foreign>furniture</lang:Foreign> વગર.
    263.885 - 270.705
    <lang:Foreign>furnished flat</lang:Foreign> માટે <lang:Foreign>option available</lang:Foreign> છે. એના માટે પાંચ લાખ જેવું <lang:Foreign>extra</lang:Foreign> થશે. એમાં <lang:Foreign>semi furnished flat</lang:Foreign> પણ <lang:Foreign>available</lang:Foreign> જ છે.
    269.985 - 270.240
    -
    270.839 - 271.054
    -
    272.465 - 276.225
    તો હું એક વખત આ <lang:Foreign>flat visit</lang:Foreign> કરવા માગુ છું. તો હું ક્યારે <lang:Foreign>visit</lang:Foreign> કરવા આવી શકુ?
    279.545 - 280.585
    <lang:Foreign>okay ,</lang:Foreign> તો~ ક્યારે પણ આવી શકો છો. કાલે અગિયાર વાગે આસપાસ <lang:Foreign>free</lang:Foreign> હોય તો આવી જાવ.
    280.885 - 284.865
    ક્યારે પણ આવી શકો છો. કાલે અગિયાર વાગે આસપાસ <lang:Foreign>free</lang:Foreign> હોય તો આવી જાવ.
    286.345 - 287.985
    કાલે અંગિયાર વાગ્યા સુધી~ હું તમને સાંજ સુંધી માં જણાવું તો કઈ વાંધો આવશે કે પછી?
    288.585 - 291.845
    હું તમને સાંજ સુંધી માં જણાવું તો કઈ વાંધો આવશે કે પછી?
    294.125 - 295.605
    ના વાંધો નઈ આવી જજોને.
    296.825 - 299.785
    એટલે કાલે અગિયાર વાગ્તા સુધી તો મારા <lang:Foreign>family</lang:Foreign> સાથે આવું. અને બધું <lang:Foreign>flat</lang:Foreign> નું જોઈને? વાતચીત કરીએ ત્યાજ તો. ચાલશે કે પછી એની માટે અપણે અલગથી ક્યારેક મળવું પડશે.
    300.525 - 301.905
    અને બધું <lang:Foreign>flat</lang:Foreign> નું જોઈને?
    302.485 - 303.985
    વાતચીત કરીએ ત્યાજ તો.
    304.505 - 307.305
    ચાલશે કે પછી એની માટે અપણે અલગથી ક્યારેક મળવું પડશે.
    310.185 - 316.005
    વાંધો નઈ કાલે આવો <lang:Foreign>family</lang:Foreign> સાથે <lang:Foreign>furnished flat</lang:Foreign> પણ બતાવી દઈશું. <lang:Foreign>two <initial>BHK</initial>, three <initial>BHK</initial></lang:Foreign> બંને <lang:Foreign>available</lang:Foreign> છે.
    316.685 - 317.885
    બંને <lang:Foreign>available</lang:Foreign> છે.
    317.005 - 318.085
    તો ફરીથી. <lang:Foreign>furniture</lang:Foreign> વગર પણ <lang:Foreign>available</lang:Foreign> છે. જોવા હોય તો મળી જશે. કાલ જોવા.
    318.785 - 322.125
    <lang:Foreign>furniture</lang:Foreign> વગર પણ <lang:Foreign>available</lang:Foreign> છે. જોવા હોય તો મળી જશે. કાલ જોવા.
    323.205 - 326.285
    હાં તો કાંઈ વાંધો નહીં તો કાલે મું અગિયાર વાગે મારી <lang:Foreign>family</lang:Foreign> સાથે આવું.
    328.165 - 329.725
    <lang:Foreign>okay ,</lang:Foreign> વાંધો નઈ <lang:Foreign>most welcome</lang:Foreign>
    330.445 - 331.565
    <lang:Foreign>okay, thank you! </lang:Foreign>

    Dataset Details

    Card Head Line

    Language

    Gujarati

    Language code

    gu-in

    Country

    India

    Accents

    Kathiawari, Amdawadi Gujarati ...more

    Gender Distribution

    M:60, F:40

    Age Group

    18-70 Years

    File Details

    Card Head Line

    Environment

    Silent, Noisy

    Bit Depth

    16 bit

    Format

    wav

    Sample rate

    8khz & 16khz

    Channel

    Stereo (dual-channel, separated speakers)

    Audio file duration

    5-15 minutes

    Need datasets for a specific AI/ML use case?
    Don't worry, we've got you covered! 👍

    Contact Us
    Prompt 2 Bg