We Use Cookies!!!
We use cookies to ensure that we give you the best experience on our website. Read cookies policies.
The audio dataset consist of general conversations between native Marathi people from India along with metadata and transcription.
Unscripted General Conversations
60 Speech Hours
July 2023
Welcome to the Marathi Language General Conversation Speech Dataset, a comprehensive and diverse collection of voice data specifically curated to advance the development of Marathi language speech recognition models, with a particular focus on Indian accents and dialects.
With high-quality audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and Generative Voice AI algorithms. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Marathi language spoken in India.
Speech Data:
This training dataset comprises 50 hours of audio recordings covering a wide range of topics and scenarios, ensuring robustness and accuracy in speech technology applications. To achieve this, we collaborated with a diverse network of 70 native Marathi speakers from different part of Maharashtra. This collaborative effort guarantees a balanced representation of Indian accents, dialects, and demographics, reducing biases and promoting inclusivity.
Each audio recording captures the essence of spontaneous, unscripted conversations between two individuals, with an average duration ranging from 15 to 60 minutes. The speech data is available in WAV format, with stereo channel files having a bit depth of 16 bits and a sample rate of 8 kHz. The recording environment is generally quiet, without background noise and echo.
In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This metadata includes the participant's age, gender, country, state, and dialect. Furthermore, additional metadata such as recording device detail, topic of recording, bit depth, and sample rate will be provided.
The metadata serves as a valuable tool for understanding and characterizing the data, facilitating informed decision-making in the development of Marathi language speech recognition models.
This dataset provides a manual verbatim transcription of each audio file to enhance your workflow efficiency. The transcriptions are available in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags.
Our goal is to expedite the deployment of Marathi language conversational AI and NLP models by offering ready-to-use transcriptions, ultimately saving valuable time and resources in the development process.
Updates and Customization:
We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our voice dataset is regularly updated with new audio data captured in diverse real-world conditions.
If you require a custom training dataset with specific environmental conditions such as in-car, busy street, restaurant, or any other scenario, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.
This audio dataset, created by FutureBeeAI, is now available for commercial use.
Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, exploring generative voice AI, or building cutting-edge voice assistants and bots, our dataset serves as a reliable and valuable resource.
Channel 1 | Channel 2 | Format |
Male(33) | Male(33) | wav, json |
Speech | 0.000 | 0.375 | Speaker 2 | <lang:Foreign>Hello</lang:Foreign> |
Speech | 1.074 | 1.575 | Speaker 1 | <lang:Foreign>Hello</lang:Foreign> |
Speech | 1.899 | 2.774 | Speaker 1 | <lang:Foreign>Hello Futurebee</lang:Foreign> |
Speech | 2.624 | 3.325 | Speaker 2 | <lang:Foreign>Hello future</lang:Foreign> |
Speech | 3.875 | 4.750 | Speaker 2 | <lang:Foreign>Hello Futurebee</lang:Foreign> |
Speech | 5.500 | 6.823 | Speaker 1 | हा कसा आहेस मित्रा? |
Speech | 7.886 | 9.336 | Speaker 2 | मजेत मजेत, तू कसा आहेस? |
Speech | 9.576 | 10.525 | Speaker 1 | (()) मी पण मजेत |
Speech | 11.125 | 12.275 | Speaker 1 | काय चाललंय? काय करतोय? |
Speech | 13.824 | 16.222 | Speaker 2 | काही नाही बसलोय जेवण झालं तुझं? |
Speech | 16.500 | 17.501 | Speaker 1 | हो माझं झालं |
Speech | 18.442 | 19.468 | Speaker 1 | तुझं झालं का जेवण? |
Speech | 19.385 | 20.111 | Speaker 2 | काय विशेष? |
Speech | 20.911 | 21.736 | Speaker 2 | माझं पण झालं |
Speech | 22.228 | 24.277 | Speaker 1 | आज विशेष असं काही नव्हतं |
Speech | 24.475 | 25.602 | Speaker 1 | चपाती भाजी |
Speech | 26.772 | 27.873 | Speaker 1 | <lang:Foreign>Rice</lang:Foreign> |
Speech | 27.973 | 28.710 | Speaker 2 | अरे आज र |
Speech | 29.202 | 31.452 | Speaker 2 | अरे आज रविवार काही <lang:Foreign>Special Chicken</lang:Foreign> विकन |
Speech | 31.518 | 33.694 | Speaker 1 | नाही नाही तसं <lang:Foreign>Special</lang:Foreign> आज काय नव्हतं |
Speech | 34.167 | 37.518 | Speaker 1 | (()) [laugh] आज तुमच्याकडे काय <lang:Foreign>Special</lang:Foreign> होतं? |
Speech | 35.627 | 36.926 | Speaker 2 | [laugh] |
Speech | 39.718 | 41.768 | Speaker 2 | <lang:Foreign>Special</lang:Foreign>असं काही नाही <lang:Foreign>Regular</lang:Foreign> च आपलं |
Speech | 43.460 | 47.561 | Speaker 2 | निवांत मग रविवारी काय विशेष असं? <lang:Foreign>Cricket</lang:Foreign> बिकेट खेळायला जातोस का? |
Speech | 47.926 | 50.051 | Speaker 1 | (()) नाही आता सध्या तरी नाही जात आहे. |
Speech | 52.210 | 52.936 | Speaker 2 | [filler] |
Speech | 52.887 | 56.262 | Speaker 1 | एक वर्षापासून तर <lang:Foreign>Cricket</lang:Foreign> एक दीडवर्षा पासून <lang:Foreign>Cricket</lang:Foreign> तर बंद केलंय खेळणं. |
Speech | 57.253 | 60.228 | Speaker 2 | का बरं? वेळ नाही भेटत ना? |
Speech | 59.661 | 65.563 | Speaker 1 | आं आता वेळ पण नाही भेटत आणि आत्ता आपलं जरा <lang:Foreign>Body</lang:Foreign> अशी स्थूल झाल्यासारखी वाटायला लागली आणि आता असं वाटतं नाही |
Speech | 66.236 | 68.637 | Speaker 1 | कि <lang:Foreign>Fielding</lang:Foreign>करावी पळावं [laugh] |
Speech | 69.771 | 71.796 | Speaker 1 | हां तरी मागच्या वर्षी मी खेळलो. |
Speech | 70.694 | 71.620 | Speaker 2 | [laugh] |
Speech | 72.162 | 73.438 | Speaker 1 | हां एक [filler] |
Speech | 74.087 | 78.438 | Speaker 1 | हां मागच्या वर्षी खेळलो होतो इथेच खेळलो होतो आपल्या देहू रोड मधे एका <lang:Foreign>Ground</lang:Foreign>वर होत्या <lang:Foreign>Match</lang:Foreign> |
Speech | 74.920 | 75.396 | Speaker 2 | हां |
Speech | 79.796 | 82.596 | Speaker 1 | इथे खेळलो होतो आणि चांगला खेळ केला होता मी तिथे |
Speech | 82.328 | 83.055 | Speaker 2 | (()) |
Speech | 85.030 | 88.631 | Speaker 1 | हं म्हणजे त्यांच्या कडे <lang:Foreign>Player</lang:Foreign> कमी होता आणि त्यांनी मला खेळवलं. |
Speech | 86.796 | 87.471 | Speaker 2 | अरे वा. |
Speech | 89.456 | 96.331 | Speaker 1 | [laugh] आणि त्यांचे पहिल्याच <lang:Foreign>Match</lang:Foreign>मध्ये काही तरी चार <lang:Foreign>Wicket</lang:Foreign>गेले नंतर मग <lang:Foreign>Batting</lang:Foreign>ला जायला घाबरायला लागले |
Speech | 93.138 | 93.638 | Speaker 2 | [filler] |
Speech | 96.739 | 103.688 | Speaker 1 | अं <lang:Foreign>Score</lang:Foreign> [laugh] समोर बघून मग मी म्हंटल आपण आधी ह्यांच्या <lang:Foreign>Team</lang:Foreign> मध्ये आपण नाहीय ह्यांनी असच <lang:Foreign>Voluntary</lang:Foreign> म्हणून बसवलं होतं. |
Speech | 104.290 | 108.840 | Speaker 1 | <lang:Foreign>Bat</lang:Foreign>घेतली गेलो दोन चौकार मारले आणि <lang:Foreign>Match</lang:Foreign> जिंकवली. |
Speech | 108.674 | 109.299 | Speaker 2 | [filler] |
Speech | 109.757 | 114.132 | Speaker 1 | आणि मग त्याच्या नंतर एवढे <lang:Foreign>Impress</lang:Foreign> झाले कि मला <lang:Foreign>Opening</lang:Foreign> लाच पाठवायला लागले |
Speech | 110.438 | 111.097 | Speaker 2 | हां |
Speech | 113.450 | 114.025 | Speaker 2 | अरे वा. |
Speech | 114.325 | 117.882 | Speaker 1 | आं दोन आ तीन <lang:Foreign>Matches opening</lang:Foreign> ला पाठवल्या |
Speech | 118.542 | 121.310 | Speaker 1 | आणि खूपच धुवांधार <lang:Foreign>बल्लेबाजी</lang:Foreign> केली मी तिथे. |
Speech | 122.751 | 123.379 | Speaker 2 | [filler] |
Speech | 125.248 | 127.489 | Speaker 2 | आणि तरी नशीब अशी <lang:Foreign>Practice</lang:Foreign> नव्हती हाय ना |
Babble | 125.739 | 127.263 | - | - |
Speech | 127.290 | 130.442 | Speaker 1 | मी आता तिसऱ्या <lang:Foreign>Match</lang:Foreign> ला तर मी आता <lang:Foreign>Single Run</lang:Foreign> काढून |
Speech | 130.800 | 135.025 | Speaker 1 | दुसरी <lang:Foreign>Run</lang:Foreign> धावाय पळत यायचो तर मी मधेच अर्ध्या <lang:Foreign>Pitch</lang:Foreign> वरच पडायचो |
Speech | 135.275 | 138.598 | Speaker 1 | [laugh] इतकी <lang:Foreign>energy</lang:Foreign>संपली होती कारण |
Speech | 138.871 | 142.020 | Speaker 1 | एका दिवशी तीन तीन <lang:Foreign>Match</lang:Foreign>खेळायची सवय नव्हती ना एवढी. |
Speech | 139.258 | 140.008 | Speaker 2 | [laugh] |
Speech | 144.175 | 145.050 | Speaker 1 | हा. |
Speech | 144.491 | 147.241 | Speaker 2 | अरे बापरे त्यांनी पण तुला <lang:Foreign>Break</lang:Foreign> द्यायला पाहिजे होता. |
Speech | 147.431 | 149.960 | Speaker 1 | हो पण खेळलो ए ए |
Speech | 148.627 | 150.002 | Speaker 2 | <lang:Foreign>A Energy</lang:Foreign> |
Speech | 150.228 | 156.054 | Speaker 1 | आ आपण संघ असं ते म्हणजे <lang:Foreign>Player</lang:Foreign>नसतानाही आम्ही तो संघ <lang:Foreign>Semi Final</lang:Foreign> पर्यंत घेऊन गेलो |
Speech | 156.776 | 161.804 | Speaker 1 | आणि हं <lang:Foreign>Semi final</lang:Foreign>पर्यंत च झाली <lang:Foreign>Semi Final Final</lang:Foreign> दुसऱ्या दिवशी होती |
Speech | 158.122 | 158.698 | Speaker 2 | हूं हूं |
Speech | 163.751 | 170.776 | Speaker 1 | मग मी दुसऱया दिवशी काही मला <lang:Foreign>Possible</lang:Foreign> झाले नाही मग मी गेलो नाही आणि हारले मग दुसऱया दिवशी <lang:Foreign>Batsman</lang:Foreign>नव्हते [laugh] |
Speech | 165.442 | 165.889 | Speaker 2 | बरं. |
Speech | 172.965 | 176.788 | Speaker 2 | [laugh] आणि मग त्यांनी <lang:Foreign>Phone</lang:Foreign> बिन केले असतील बरेचशे या म्हणून. |
Speech | 176.120 | 181.020 | Speaker 1 | हो नाही मी जातानाच त्यांना सांगितलं होतं मला वाटलं मी असाच <lang:Foreign>Match</lang:Foreign> बघायला म्हणून गेलो होतो. |
0.000 0.375 | <lang:Foreign>Hello</lang:Foreign> |
1.074 1.575 | <lang:Foreign>Hello</lang:Foreign> |
1.899 2.774 | <lang:Foreign>Hello Futurebee</lang:Foreign> |
2.624 3.325 | <lang:Foreign>Hello future</lang:Foreign> |
3.875 4.750 | <lang:Foreign>Hello Futurebee</lang:Foreign> |
5.500 6.823 | हा कसा आहेस मित्रा? |
7.886 9.336 | मजेत मजेत, तू कसा आहेस? |
9.576 10.525 | (()) मी पण मजेत |
11.125 12.275 | काय चाललंय? काय करतोय? |
13.824 16.222 | काही नाही बसलोय जेवण झालं तुझं? |
16.500 17.501 | हो माझं झालं |
18.442 19.468 | तुझं झालं का जेवण? |
19.385 20.111 | काय विशेष? |
20.911 21.736 | माझं पण झालं |
22.228 24.277 | आज विशेष असं काही नव्हतं |
24.475 25.602 | चपाती भाजी |
26.772 27.873 | <lang:Foreign>Rice</lang:Foreign> |
27.973 28.710 | अरे आज र |
29.202 31.452 | अरे आज रविवार काही <lang:Foreign>Special Chicken</lang:Foreign> विकन |
31.518 33.694 | नाही नाही तसं <lang:Foreign>Special</lang:Foreign> आज काय नव्हतं |
34.167 37.518 | (()) [laugh] आज तुमच्याकडे काय <lang:Foreign>Special</lang:Foreign> होतं? |
35.627 36.926 | [laugh] |
39.718 41.768 | <lang:Foreign>Special</lang:Foreign>असं काही नाही <lang:Foreign>Regular</lang:Foreign> च आपलं |
43.460 47.561 | निवांत मग रविवारी काय विशेष असं? <lang:Foreign>Cricket</lang:Foreign> बिकेट खेळायला जातोस का? |
47.926 50.051 | (()) नाही आता सध्या तरी नाही जात आहे. |
52.210 52.936 | [filler] |
52.887 56.262 | एक वर्षापासून तर <lang:Foreign>Cricket</lang:Foreign> एक दीडवर्षा पासून <lang:Foreign>Cricket</lang:Foreign> तर बंद केलंय खेळणं. |
57.253 60.228 | का बरं? वेळ नाही भेटत ना? |
59.661 65.563 | आं आता वेळ पण नाही भेटत आणि आत्ता आपलं जरा <lang:Foreign>Body</lang:Foreign> अशी स्थूल झाल्यासारखी वाटायला लागली आणि आता असं वाटतं नाही |
66.236 68.637 | कि <lang:Foreign>Fielding</lang:Foreign>करावी पळावं [laugh] |
69.771 71.796 | हां तरी मागच्या वर्षी मी खेळलो. |
70.694 71.620 | [laugh] |
72.162 73.438 | हां एक [filler] |
74.087 78.438 | हां मागच्या वर्षी खेळलो होतो इथेच खेळलो होतो आपल्या देहू रोड मधे एका <lang:Foreign>Ground</lang:Foreign>वर होत्या <lang:Foreign>Match</lang:Foreign> |
74.920 75.396 | हां |
79.796 82.596 | इथे खेळलो होतो आणि चांगला खेळ केला होता मी तिथे |
82.328 83.055 | (()) |
85.030 88.631 | हं म्हणजे त्यांच्या कडे <lang:Foreign>Player</lang:Foreign> कमी होता आणि त्यांनी मला खेळवलं. |
86.796 87.471 | अरे वा. |
89.456 96.331 | [laugh] आणि त्यांचे पहिल्याच <lang:Foreign>Match</lang:Foreign>मध्ये काही तरी चार <lang:Foreign>Wicket</lang:Foreign>गेले नंतर मग <lang:Foreign>Batting</lang:Foreign>ला जायला घाबरायला लागले |
93.138 93.638 | [filler] |
96.739 103.688 | अं <lang:Foreign>Score</lang:Foreign> [laugh] समोर बघून मग मी म्हंटल आपण आधी ह्यांच्या <lang:Foreign>Team</lang:Foreign> मध्ये आपण नाहीय ह्यांनी असच <lang:Foreign>Voluntary</lang:Foreign> म्हणून बसवलं होतं. |
104.290 108.840 | <lang:Foreign>Bat</lang:Foreign>घेतली गेलो दोन चौकार मारले आणि <lang:Foreign>Match</lang:Foreign> जिंकवली. |
108.674 109.299 | [filler] |
109.757 114.132 | आणि मग त्याच्या नंतर एवढे <lang:Foreign>Impress</lang:Foreign> झाले कि मला <lang:Foreign>Opening</lang:Foreign> लाच पाठवायला लागले |
110.438 111.097 | हां |
113.450 114.025 | अरे वा. |
114.325 117.882 | आं दोन आ तीन <lang:Foreign>Matches opening</lang:Foreign> ला पाठवल्या |
118.542 121.310 | आणि खूपच धुवांधार <lang:Foreign>बल्लेबाजी</lang:Foreign> केली मी तिथे. |
122.751 123.379 | [filler] |
125.248 127.489 | आणि तरी नशीब अशी <lang:Foreign>Practice</lang:Foreign> नव्हती हाय ना |
125.739 127.263 | - |
127.290 130.442 | मी आता तिसऱ्या <lang:Foreign>Match</lang:Foreign> ला तर मी आता <lang:Foreign>Single Run</lang:Foreign> काढून |
130.800 135.025 | दुसरी <lang:Foreign>Run</lang:Foreign> धावाय पळत यायचो तर मी मधेच अर्ध्या <lang:Foreign>Pitch</lang:Foreign> वरच पडायचो |
135.275 138.598 | [laugh] इतकी <lang:Foreign>energy</lang:Foreign>संपली होती कारण |
138.871 142.020 | एका दिवशी तीन तीन <lang:Foreign>Match</lang:Foreign>खेळायची सवय नव्हती ना एवढी. |
139.258 140.008 | [laugh] |
144.175 145.050 | हा. |
144.491 147.241 | अरे बापरे त्यांनी पण तुला <lang:Foreign>Break</lang:Foreign> द्यायला पाहिजे होता. |
147.431 149.960 | हो पण खेळलो ए ए |
148.627 150.002 | <lang:Foreign>A Energy</lang:Foreign> |
150.228 156.054 | आ आपण संघ असं ते म्हणजे <lang:Foreign>Player</lang:Foreign>नसतानाही आम्ही तो संघ <lang:Foreign>Semi Final</lang:Foreign> पर्यंत घेऊन गेलो |
156.776 161.804 | आणि हं <lang:Foreign>Semi final</lang:Foreign>पर्यंत च झाली <lang:Foreign>Semi Final Final</lang:Foreign> दुसऱ्या दिवशी होती |
158.122 158.698 | हूं हूं |
163.751 170.776 | मग मी दुसऱया दिवशी काही मला <lang:Foreign>Possible</lang:Foreign> झाले नाही मग मी गेलो नाही आणि हारले मग दुसऱया दिवशी <lang:Foreign>Batsman</lang:Foreign>नव्हते [laugh] |
165.442 165.889 | बरं. |
172.965 176.788 | [laugh] आणि मग त्यांनी <lang:Foreign>Phone</lang:Foreign> बिन केले असतील बरेचशे या म्हणून. |
176.120 181.020 | हो नाही मी जातानाच त्यांना सांगितलं होतं मला वाटलं मी असाच <lang:Foreign>Match</lang:Foreign> बघायला म्हणून गेलो होतो. |
M: 55, F: 45
Silent, Noisy
16 bit
Dual separate channel
15-60 minutes
Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.
Download Free Dataset
Contact Us