Arabic (Saudi Arabia) Call Center Speech Dataset for BFSI

The audio dataset includes call center conversations in BFSI, featuring native Arabic speakers from Saudi Arabia, with detailed metadata and accurate transcriptions.

Category

Unscripted Call Center Conversations

Total Volume

40 Speech Hours

Last updated

July 2023

Number of participants

80

Get this Speech Dataset

Get Dataset Btn

About this Off-the-shelf Speech Dataset

About Gradiet Line

What’s Included

Welcome to the Saudi Arabian Arabic Call Center Speech Dataset for the BFSI domain. It is a specialized and comprehensive collection of voice data designed to enhance the development of call center speech recognition models specifically for the BFSI industry.


With high-quality call center audio recordings, detailed metadata, and accurate transcriptions, it empowers researchers and developers to enhance natural language processing, conversational AI, and generative voice AI algorithms in the BFSI domain. Moreover, it facilitates the creation of sophisticated voice assistants and voice bots tailored to the unique linguistic nuances found in the Arabic language spoken in Saudi Arabia.


Speech Data:

This training dataset comprises 40 hours of call center audio recordings covering various topics and scenarios related to the BFSI domain, to build robust and accurate customer service speech technology.


To curate realistic call center interactions, we collaborated with a diverse network of 80 expert native Arabic speakers from different states/provinces of Saudi Arabia. This collaborative effort ensures a balanced representation of Saudi Arabian accents, dialects, and demographics, promoting inclusivity and reducing biases in the dataset.


Each audio recording captures the essence of unscripted and spontaneous conversations between call center agents and customers, with an average duration ranging from 5 to 15 minutes per call. The dataset includes both inbound and outbound calls, covering scenarios such as inquiries, promotional offers, complaints, technical support, and more. Additionally, the dataset contains call center conversations with both positive and negative outcomes, providing a diverse and realistic dataset.


The speech data is available in WAV format with stereo channels, a bit depth of 16 bits, and a sample rate of 8 kHz, ensuring high-quality audio for accurate analysis. The recording environment is generally quiet, without background noise and echo.


Metadata:

In addition to the audio recordings, our dataset provides comprehensive metadata for each participant. This includes the participant’s age, gender, country, state, and dialect. Additionally, it includes metadata like domain, topic, call type, outcome, bit depth, and sample rate for each conversation.


The metadata serves as a powerful tool for understanding and characterizing the data, enabling informed decision-making in the development of Arabic call center speech recognition models for the BFSI domain.


Transcription:

To facilitate your workflow, the dataset includes manual verbatim transcriptions of each call center audio file in JSON format. The transcriptions capture speaker-wise transcription with time-coded segmentation along with non-speech labels and tags, covering both the agent and customer conversations.


These ready-to-use transcriptions accelerate the development of BFSI call center conversational AI and ASR models for the Arabic language.


Updates and Customization:

We understand the importance of collecting data in various environments to build robust ASR models. Therefore, our call center voice dataset is regularly updated with new audio data captured in diverse real-world conditions.


If you require a custom training dataset with specific environmental conditions, we can accommodate your request. We can provide voice data with customized sample rates ranging from 8kHz to 48kHz, allowing you to fine-tune your models for different audio recording setups. Additionally, we can also customize the transcription following your specific guidelines and requirements, to further support your ASR development process.


License:

This BFSI call center audio dataset is created by FutureBeeAI and is available for commercial use!


Conclusion:

Whether you are training or fine-tuning speech recognition models, advancing NLP algorithms, or building state-of-the-art voice assistants to improve customer experiences in the BFSI sector, our dataset serves as a trusted resource to meet your goals


Use Cases

Use of speech data for Automatic Speech Recognition

ASR

Use of speech data in Conversational AI

Conversational AI

Use of speech data for Chatbot & voicebot creation

Chatbot

Use of speech data in Language Modeling

Language Modelling

Use of speech data in Text-into-speech

TTS

Speech data usecase in Speech Analytics

Speech Analytics

Dataset Sample(s)

Sample Line

ATTRIBUTES

Channel 1Channel 2Format
Female(36)Male(34)wav, json

TRANSCRIPTION

LABELSTARTENDCHANNELTRANSCRIPT
Speech0.3361.675Speaker 1<lang:Foreign>Hello Futurebee</lang:Foreign>
Speech3.7854.883Speaker 2<lang:Foreign>Hello Futurebee</lang:Foreign>
Speech8.94512.381Speaker 1شكرا لاتصالكم بالبنك العربي, تفضل أيش مشكلتك سيد حمزة
Speech14.09817.946Speaker 2واللهي أنا إني أواجه مشكله بالد~ بالدخول أحيانا بال <lang:Foreign>Login</lang:Foreign>
Noise16.88217.169--
Speech18.62327.097Speaker 2(()) في يعني في أوقات أحط ال <lang:Foreign>Password</lang:Foreign> ما يزبط وأوقات يعني عالبصمه برضو, لأني أنا حاولت اشبكها عالبصمه
Noise19.31219.410--
Noise28.14028.204--
Speech28.38832.289Speaker 2بظل يطلعلي <lang:Foreign>Password</lang:Foreign> فهاي مشكله عندي, كيف ممكن نحلها هاي المشكلة
Noise32.78332.945--
Noise33.51733.667--
Speech33.90836.569Speaker 1طيب, أنت الحين مفعل البصمه؟ مفعل الوجه؟
Speech38.07040.651Speaker 2إيه والله نعم(()) بصمة الوجه نعم(())مفعلها
Speech41.79244.722Speaker 1تمام مف~مفعل الرمز السري حق ال <lang:Foreign>Account</lang:Foreign> حقك
Noise44.39244.508--
Speech46.40846.774Speaker 2ايوا
Speech47.32553.347Speaker 2يعني ان~أنا فكرتي انو أنا م~ماا أبي(()) يعني مثلا انتي تعرفين الواحد أوفات يحتاج البنك بسرعه
Noise48.49948.658--
Speech53.67958.283Speaker 2ما يبيله يعني يحط ال <lang:Foreign>Password</lang:Foreign>
Speech58.81360.200Speaker 2يبيله عالسريع يا يفتح (())علی الوجه علی ال <lang:Foreign>Face</lang:Foreign> او انه عالبصمه يعني ايه
Noise59.15859.365--
Noise60.78361.283--
Speech62.07368.748Speaker 1ايه ,طيب اتحملني ابى اسالك كم سؤال بالاول عشان اتاكد انك انت حمزه , لو سمحت حمزه مواليد اي سنه انت؟
Speech70.92473.674Speaker 2انأ مواليد سنه ألف و تسمعميه و ثمان و ثمانين
Noise73.12373.123--
Speech74.31176.489Speaker 1تمام, ايش أخر حركه صارت على حسابك؟
Noise76.57876.668--
Speech78.48081.427Speaker 2انيش~انا عبيت بنزين قبل تقريبا ربع ساعه
Noise81.26681.730--
Speech83.32892.552Speaker 1لحظات ا~أشوف ايه نعم صحيح صحيح تمام ايه طيب(()) سيد حمزة, الحين ابغى أسالك إنت سويت ال <lang:Foreign>Account</lang:Foreign>حقك من زياره فرع لنا؟
Noise87.91589.533--
Speech93.16294.525Speaker 1ولا عن طريق التطبيق؟
Noise95.17795.668--
Speech96.855104.522Speaker 2ان~أنا أول شي سويته عن طريق التطبيق لكن (()) قالولي قالولي لازم لازم انو اروح على الفرع عشان اثبت معلوماتي
Noise97.98998.337--
Noise102.328102.677--
Noise103.936104.078--
Noise105.355105.480--
Speech105.569110.611Speaker 2فا أنا رحت عليهم وأعطيتهم الهُوِيَّة و الكل شي وفعلتها من ال~من الفرع~
Noise106.524107.382--
Speech112.543125.700Speaker 1تمام الحين في ثلاث طرق عشان تقدر تفوت على ال <lang:Foreign>Application</lang:Foreign> حق البنك أول طريقه انك أنت تدخل ال~ الرق~ ال~كلمه أو الرقم السري اللي انت أدخلتها يوم زرت الفرع حقنا
Speech120.275120.659Speaker 2ايه
Speech126.641132.228Speaker 1ثاني طريقه انك انت توصله بالبصمة حقت الجهاز جهازك اندرويد ولا ايفون
Speech135.187136.026Speaker 2لا جهازي اندرويد
Speech135.776137.818Speaker 1اندرويد (()) تعرف وش ال <lang:Foreign>version</lang:Foreign> حقه؟
Speech139.687141.276Speaker 2لا والله ما ادري بصراحه
Speech142.449146.649Speaker 1ايه طيب ثواني أتأكد أشوف إذا عندي بال <lang:Foreign>System</lang:Foreign> طالع لو سمحت, ثواني
Speech146.651152.407Speaker 2إه والله يا ريت يعني يقدر يطلعلش عندش انتي إذا شو نوع التلفون تبعي ولا لا ما ادري أنا بصراحه, إذا تقدرون عليه
Noise147.354147.514--
Speech151.954156.097Speaker 1ايه ايه نعم, هذا هو هذا هو طلع ال~ الإصدار رقم حدعش
Noise152.686152.794--
Noise152.907153.186--
Speech156.603160.578Speaker 1طيب الحين ال~ النوع الثالث لل~
Speech157.651158.508Speaker 2ماشالله
Noise158.865159.115--
Speech161.175162.722Speaker 1التسجيل الدخول
Speech161.461164.776Speaker 2(())رقم احدش هوا زين ولا مو زين يعني
Speech165.936166.794Speaker 1ايه زين زين
Speech166.776170.401Speaker 2قديم ولا جديد؟ عشان إذا مو جديد نجدده يعني, عشان إذا فيه مشكله
Speech167.919168.354Speaker 1ايه زين
Speech171.080171.300Speaker 2طيب
Noise172.354172.419--
Speech172.639174.943Speaker 1لا لا, متوافق مع(()) تطبيق البنك
Speech175.633178.032Speaker 1(()) الطريقة الثالثة سيد حمزة
Speech175.937176.657Speaker 2خلاص ممتاز
Babble176.061177.729--

TRANSCRIPTION

TIMETRANSCRIPT
0.336
1.675
<lang:Foreign>Hello Futurebee</lang:Foreign>
3.785
4.883
<lang:Foreign>Hello Futurebee</lang:Foreign>
8.945
12.381
شكرا لاتصالكم بالبنك العربي, تفضل أيش مشكلتك سيد حمزة
14.098
17.946
واللهي أنا إني أواجه مشكله بالد~ بالدخول أحيانا بال <lang:Foreign>Login</lang:Foreign>
16.882
17.169
-
18.623
27.097
(()) في يعني في أوقات أحط ال <lang:Foreign>Password</lang:Foreign> ما يزبط وأوقات يعني عالبصمه برضو, لأني أنا حاولت اشبكها عالبصمه
19.312
19.410
-
28.140
28.204
-
28.388
32.289
بظل يطلعلي <lang:Foreign>Password</lang:Foreign> فهاي مشكله عندي, كيف ممكن نحلها هاي المشكلة
32.783
32.945
-
33.517
33.667
-
33.908
36.569
طيب, أنت الحين مفعل البصمه؟ مفعل الوجه؟
38.070
40.651
إيه والله نعم(()) بصمة الوجه نعم(())مفعلها
41.792
44.722
تمام مف~مفعل الرمز السري حق ال <lang:Foreign>Account</lang:Foreign> حقك
44.392
44.508
-
46.408
46.774
ايوا
47.325
53.347
يعني ان~أنا فكرتي انو أنا م~ماا أبي(()) يعني مثلا انتي تعرفين الواحد أوفات يحتاج البنك بسرعه
48.499
48.658
-
53.679
58.283
ما يبيله يعني يحط ال <lang:Foreign>Password</lang:Foreign>
58.813
60.200
يبيله عالسريع يا يفتح (())علی الوجه علی ال <lang:Foreign>Face</lang:Foreign> او انه عالبصمه يعني ايه
59.158
59.365
-
60.783
61.283
-
62.073
68.748
ايه ,طيب اتحملني ابى اسالك كم سؤال بالاول عشان اتاكد انك انت حمزه , لو سمحت حمزه مواليد اي سنه انت؟
70.924
73.674
انأ مواليد سنه ألف و تسمعميه و ثمان و ثمانين
73.123
73.123
-
74.311
76.489
تمام, ايش أخر حركه صارت على حسابك؟
76.578
76.668
-
78.480
81.427
انيش~انا عبيت بنزين قبل تقريبا ربع ساعه
81.266
81.730
-
83.328
92.552
لحظات ا~أشوف ايه نعم صحيح صحيح تمام ايه طيب(()) سيد حمزة, الحين ابغى أسالك إنت سويت ال <lang:Foreign>Account</lang:Foreign>حقك من زياره فرع لنا؟
87.915
89.533
-
93.162
94.525
ولا عن طريق التطبيق؟
95.177
95.668
-
96.855
104.522
ان~أنا أول شي سويته عن طريق التطبيق لكن (()) قالولي قالولي لازم لازم انو اروح على الفرع عشان اثبت معلوماتي
97.989
98.337
-
102.328
102.677
-
103.936
104.078
-
105.355
105.480
-
105.569
110.611
فا أنا رحت عليهم وأعطيتهم الهُوِيَّة و الكل شي وفعلتها من ال~من الفرع~
106.524
107.382
-
112.543
125.700
تمام الحين في ثلاث طرق عشان تقدر تفوت على ال <lang:Foreign>Application</lang:Foreign> حق البنك أول طريقه انك أنت تدخل ال~ الرق~ ال~كلمه أو الرقم السري اللي انت أدخلتها يوم زرت الفرع حقنا
120.275
120.659
ايه
126.641
132.228
ثاني طريقه انك انت توصله بالبصمة حقت الجهاز جهازك اندرويد ولا ايفون
135.187
136.026
لا جهازي اندرويد
135.776
137.818
اندرويد (()) تعرف وش ال <lang:Foreign>version</lang:Foreign> حقه؟
139.687
141.276
لا والله ما ادري بصراحه
142.449
146.649
ايه طيب ثواني أتأكد أشوف إذا عندي بال <lang:Foreign>System</lang:Foreign> طالع لو سمحت, ثواني
146.651
152.407
إه والله يا ريت يعني يقدر يطلعلش عندش انتي إذا شو نوع التلفون تبعي ولا لا ما ادري أنا بصراحه, إذا تقدرون عليه
147.354
147.514
-
151.954
156.097
ايه ايه نعم, هذا هو هذا هو طلع ال~ الإصدار رقم حدعش
152.686
152.794
-
152.907
153.186
-
156.603
160.578
طيب الحين ال~ النوع الثالث لل~
157.651
158.508
ماشالله
158.865
159.115
-
161.175
162.722
التسجيل الدخول
161.461
164.776
(())رقم احدش هوا زين ولا مو زين يعني
165.936
166.794
ايه زين زين
166.776
170.401
قديم ولا جديد؟ عشان إذا مو جديد نجدده يعني, عشان إذا فيه مشكله
167.919
168.354
ايه زين
171.080
171.300
طيب
172.354
172.419
-
172.639
174.943
لا لا, متوافق مع(()) تطبيق البنك
175.633
178.032
(()) الطريقة الثالثة سيد حمزة
175.937
176.657
خلاص ممتاز
176.061
177.729
-

Dataset Demographics

Details Headline

Language

Arabic

Language code

ar-sa

Country

Saudi Arabia

Gender Distribution

M:55, F:45

Age Group

18-70

Audio File Details

Details Headline

Environment

Silent, Noisy

Bit Depth

16 bit

Format

wav

Sample rate

8khz

Channel

Dual separate channel

Audio file duration

5-15 minutes

Download Sample Speech Dataset Now!

Explore Audio Data, Metadata and Transcription to get more clarity and hands on experience of this dataset.

Download Free Dataset

Audio Download Btn
Audio Promp Bg
Audio Promp Bg

Start your AI/ML model creation journey with FutureBeeAI!

Contact Us

Audio Arrow BtnAudio Arrow Btn Black
Audio Promp 2 Bg