Научная статья на тему 'KLASTERLASH USULLARI YORDAMIDA NUTQNI AVTOMATIK SEGMENTATSIYALASH'

KLASTERLASH USULLARI YORDAMIDA NUTQNI AVTOMATIK SEGMENTATSIYALASH Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
11
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Nutqni avtomatik tanib olish / nutq signalini segmentatsiyalash / klasterlash / k-means usuli / noaniq c-means usuli / DBSCAN usuli / Automatic speech recognition / speech signal segmentation / clustering / k-means method / fuzzy c-means method / DBSCAN method

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — O‘rinboyev Johongir Kalbay O‘g‘li, Nugmanova Mavluda Avaz Qizi

Ushbu ishda nutq signalini avtomatik segmentatsiya qilishda zamonaviy klasterizatsiya algoritmlarining samaradorligi tahlil qilingan. K-means, noaniq c-means va DBSCAN algoritmlari asosida olingan segmentatsiya usullari qo‘llanilib, ushbu usullar yordamida so‘zlarning vaqt chegaralari aniqlangan. Olingan natijalar avtomatik nutqni qayta ishlashda ushbu algoritmlarning samaradorligini tasdiqlaydi. Shuningdek, ishda so‘zlarning aniq chegaralarini aniqlash yondashuvi tasvirlangan. Olingan natijalar nutq signalini segmentatsiyalashning boshqa usullari bilan taqqoslandi.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATIC SPEECH SEGMENTATION USING CLUSTERING METHODS

In this work, the effectiveness of modern clustering algorithms in the automatic segmentation of the speech signal is analyzed. K-means, fuzzy c-means and segmentation methods based on DBSCAN algorithms were used, and the time limits of words were determined using these methods. The obtained results confirm the effectiveness of these algorithms in automatic speech processing. Also, the work describes the approach of determining the exact boundaries of words. The obtained results were compared with other speech signal segmentation methods.

Текст научной работы на тему «KLASTERLASH USULLARI YORDAMIDA NUTQNI AVTOMATIK SEGMENTATSIYALASH»

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год

KLASTERLASH USULLARI YORDAMIDA NUTQNI AVTOMATIK SEGMENTATSIYALASH

O'rinboyev Johongir Kalbay o'g'li,

Raqamli texnologiyalar va sun'iy intellektni rivojlantirish ilmiy-tadqiqot instituti tayanch doktoranti j [email protected]

Nugmanova Mavluda Avaz qizi,

Raqamli texnologiyalar va sun'iy intellektni rivojlantirish ilmiy-tadqiqot instituti tayanch doktoranti [email protected]

Annotatsiya. Ushbu ishda nutq signalini avtomatik segmentatsiya qilishda zamonaviy klasterizatsiya algoritmlarining samaradorligi tahlil qilingan. K-means, noaniq c-means va DBSCAN algoritmlari asosida olingan segmentatsiya usullari qo'llanilib, ushbu usullar yordamida so'zlarning vaqt chegaralari aniqlangan. Olingan natijalar avtomatik nutqni qayta ishlashda ushbu algoritmlarning samaradorligini tasdiqlaydi. Shuningdek, ishda so'zlarning aniq chegaralarini aniqlash yondashuvi tasvirlangan. Olingan natijalar nutq signalini segmentatsiyalashning boshqa usullari bilan taqqoslandi.

IKalit so'zlar: Nutqni avtomatik tanib olish, nutq signalini segmentatsiyalash, klasterlash, k-means usuli, noaniq c-means usuli, DBSCAN usuli

Kirish. Avtomatik nutq segmentatsiya ko'p yillar [4] davomida o'rganib kelinmoqda va ko'plab nutqni tanib olish tizimlarining muhim, hattoki asosiy qismi hisoblanadi. Nutq segmentatsiyasi vazifasi nutq signalini qismlarga ajratish hisoblanadi. Avtomatik segmentatsiya nutqni avtomatlashtirilgan qayta ishlash algoritmlari uchun muhimdir, masalan: nutqni tanish, lingvistik korpuslar yaratish, ovozli verifikatsiya, shuningdek, tabiiy tilni qayta ishlash sohasidagi ilmiy izlanishlarda [2,3]. An'anaviy qo'lda segmentatsiyalash usuli borgan sari hajmi ortib borayotgan ovozli ma'lumotlarni qayta ishlash uchun maqbul usul emas. Qo'lda segmentatsiya qilishda katta vaqt sarfi va inson e'tiboriga yuqori talab qo'yilishi turli avtomatik segmentatsiya usullarining keng tarqalishiga olib keldi. Shular qatorida quyidagilarni sanab o'tish mumkin: veyvlet usuli yordamida segmentatsiya [1], norovshan mantiqqa asoslangan usullar [7], sun'iy neyron tarmoqlari [10] hamda yashirin Markov zanjirlaridan foydalanish [5]. Ushbu ishda k-means, noaniq c-means usullari va DBSCAN algoritmining modifikatsiyalangan versiyalari

yordamida olingan segmentatsiya usullari ko'rib chiqiladi.

Adabiyotlar tahlili va metodlar.

Nutq segmentatsiyasi. Nutqni tanib olish tizimlari ovozli signalni diskret, bir-birini qamrab olmagan tovush birliklariga bo'lishni talab qiladi [8, 9]. Bu birliklar tovushlar, bo'g'inlar, so'zlar, gaplar yoki hatto butun dialoglar bo'lishi mumkin. So'zlar - aniq tovush ifodasiga ega bo'lganligi tufayli, nutqning eng afzal ko'riladigan va tabiiy birligi hisoblanadi. Shu sababli, biz ushbu ish doirasida so'zlarni segmentatsiyaning asosiy birligi deb hisoblaymiz. Avtomatik segmentatsiya usullarini turli mezonlarga ko'ra tasniflash mumkin, ammo eng oddiy variantlardan biri segmentatsiya algoritmlarini maqsadsiz va maqsadli usullarga ajratishdir [6]. Ushbu ikki toifa usullari orasidagi asosiy farq shundan iboratki, har bir usul nutqni qayta ishlashda oldindan olingan ma'lumotlar yoki tashqi manbalardan kelib chiqqan ma'lumotlardan qanchalik samarali foydalanishidir. Maqsadsiz segmentatsiya usullari o'ziga xos tomoni shundaki, ular ishlov berilayotgan

220

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год

audio signalning tovush xususiyatlari haqidagi tashqi ma'lumotlardan foydalanmaydi. Shunday qilib, birinchi segmentatsiya bosqichida tashqi ma'lumotlar yo'qligida, ushbu usullar ishlov berilayotgan ma'lumotlarning tovush xususiyatlariga tayanadi. Ikkinchi bosqich esa odatda MFCC, LP-koeffitsientlari yoki toza FFT spektridan foydalanishga asoslanadi [14]. Ularga qarama-qarshi bo'lgan maqsadli usullar esa kerakli bo'laklarga segmentatsiya qilish uchun ishlov berilayotgan signalning tashqi tovush ma'lumotlaridan foydalanadi.

Klasterizatsiya. Klasterizatsiya - bu obyektlar to'plamini klasterlar deb ataladigan bir nechta guruhlarga bo'lish jarayoni bo'lib, ular shunday ajratiladiki, bir guruhdagi obyektlar bir-biriga boshqa klasterdagi obyektlarga qaraganda ko'proq o'xshash bo'ladi. Klasterizatsiya timsollarni tanib olish [15], intellektual ma'lumotlar tahlili [16], mashinali o'rgatish [11] va hokazo sohalarda juda keng qo'llaniladi. Klasterizatsiya algoritmlarini aniq, noaniq, potensial va ehtimoliy usullariga tasniflash mumkin [12]. Har bir guruh o'ziga xos xususiyatlarga ega. Ushbu ishda nutq segmentlarining optimal chegaralarini olish uchun aniq va noaniq klasterizatsiya algoritmlaridan foydalaniladi. Aniq klasterizatsiya usullari har bir ma'lumot obyektini qat'iy ravishda faqat bitta klasterga tegishli qilib belgilaydi. Bunday usullardan biri - k-means usuli. Noaniq klasterizatsiya usullari esa obyektdan bir vaqtning o'zida bir nechta klasterlarga tegishli bo'lishiga imkon beradi, bunda tegishlilik darajasi 0 dan 1 gacha o'zgaradi. Eng mashhur usullardan biri - noaniq c-means usuli hisoblanadi.

Nutq signalini segmentatsiyaga tayyorlash. Klasterizatsiya usullari asl nutq signalini emas, balki uning spektrogrammasini tahlil qilish uchun qo'llaniladi. Ushbu ish doirasida nutq signalini eng keng tarqalgan spektrogramma ko'rinishida tahlil qilinadi. Bu ikki o'lchovli diagramma bo'lib, vertikal o'q chastotalar o'qi, gorizontal o'q esa vaqt o'qi hisoblanadi. Spektrogrammadagi har bir nuqtaning intensivligi ma'lum bir nuqtada ma'lum bir chastotada nutq signalining amplitudasini tavsiflaydi. Original nutq signali 1-rasmda keltirilgan.

1.rasm. Original nutq signali

2-rasmda nutq signalining spektrogrammasi keltirilgan. Segmentlarning vaqt chegaralarini aniqlash uchun spektrogrammani oq-qora tasvirga aylantirish lozim, ya'ni shunday chegarani belgilash kerakki, undan past bo'lgan nuqta qora, undan yuqorisi esa oq deb qabul qilinadi. Buning uchun klasterizatsiya usulidan foydalanish mumkin.

2. rasm. Nutq signalining spektogrammasi

K-means usuli orqali klasterizatsiyalash. K-

means usuli klaster tahlilining klassik usullaridan biri hisoblanadi. Usul m kuzatuvlarni к klasterga taqsimlash uchun ishlatiladi, shunda har bir kuzatuv faqat bitta klasterga tegishli bo'ladi va u eng yaqin klaster markaziga yaqinlashtiriladi. Ushbu holatda kuzatuvlar spektrogrammadagi nuqtalar deb qabul qilinadi, klasterlar soni esa 3 ga teng [13]. Kuzatuv va klaster markazi orasidagi masofani aniqlash uchun Yevklid masofasi qo'llaniladi:

Jn

^(xp -yp)2,x,y G Rn.(ï) p=1

221

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год

Klasterlar nuqtalarining markazlaridan kvadratik og'ishlar yig'indisi minimal bo'lishi kerak:

min

e Rn,ßi e Rn, (2)

i=l x(j)esi

bu yerda ii - Si klasterining markazi.

Barcha zarur qo'shimcha tushunchalarni kiritgan holda, biz modifikatsiyalangan chegarani hisoblash algoritmini shakllantirishga o'tishimiz mumkin:

1. Klasterlar sonini tanlash.

2. Klaster ma'lumotlar markazlari klasterlar orasidagi dastlabki masofalarni maksimal darajada oshiradigan qoidaga muvofiq tanlanadi.

3. Har bir kuzatuvdan barcha klaster markazlarigacha bo'lgan masofalarni hisoblash.

4. Kuzatuvlarni hisoblangan masofalarga muvofiq klasterlarga taqsimlash (endi kuzatuv eng yaqin klasterga tegishli bo'ladi).

5. Si elementlarini o'z ichiga olgan -chi klaster markazini qayta hisoblaymiz:

х(»

x(J)esi

6. 3-banddan boshlab, 4-bandda olingan klasterlar markazlari yangi hisoblash natijasida o'zgarmaguncha davom ettiramiz.:

step t stept+1 r

I p = 1 p (4)

7. Bizga kerak bo'lgan chegaraviy qiymatni hisoblaymiz odatda bu klaster markazlarining cheklangan qiymatlarining o'rtacha qiymati bo'ladi.

Noaniq c-means usuli bilan klasterlash. K-means usuli har bir obyekt faqat bitta klasterga tegishli ekanligini taxmin qilsa, noaniq c-means usuli esa obyektning bir nechta klasterga tegishli bo'lishiga imkon beradi. Har bir obyektning tegishlilik darajalari yig'indisi 1 ga teng. Obyekt markazga qanchalik yaqin bo'lsa, bu daraja shuncha yuqori bo'ladi. Ixtiyoriy i kuzatuv va j markaz orasidagi masofani baholash uchun (1) ifodada keltirilganidek Evklid masofasi d^ ishlatiladi. Ixtiyoriy i kuzatuvning к klasterga tegishlilik darajasi quyidagicha hisoblanadi:

Vi

Si f

(3)

1

ßij

у (du) Lk=l( dj

(5)

'du\(m-D

Aik;

bu yerda m - eksponensial og'irlik. U tegishlilik darajalari matritsasiga quyidagicha ta'sir qiladi: m ^ œ bo'lganda barcha kuzatuvlar har bir klasterga bir xil ehtimollik bilan tegishli bo'ladi. Odatda 2 o'rnatiladi.

Zarur qo'shimcha tushunchalarni kiritgan holda, biz modifikatsiyalangan chegarani hisoblash algoritmini shakllantirishga o'tishimiz mumkin:

1. Klasterlar sonini tanlash.

2. Klaster ma'lumotlar markazlari klasterlar orasidagi dastlabki masofalarni maksimal darajada oshiradigan qoidaga muvofiq tanlanadi.

3. Har bir kuzatuvdan barcha klaster markazlarigacha bo'lgan masofalarni hisoblash.

4. Tegishlilik darajalari matritsasini hisoblash

U = Mn-C

5. Si elementlarini o'z ichiga olgan y'-chi klaster markazini qayta hisoblaymiz:

УП umy.

¿ji=\H-ij лi

Vj =

yn ..m . (6)

yi=llij

6. Shartlardan biri bajarilmaguncha 3-banddan takrorlaymiz:

lUk+i - ukl

< e,

(8)

bu yerda e — oldindan tanlanadigan ba'zi chegara qiymati. Ikkinchi shart: yo'qotish funksiyasi oldingi qadamda hisoblangan qiymatdan farq qilmasligi kerak.

md■■

(8)

j=l i=l

DBSCAN usuli (Density-Based Spatial Clustering of Applications with Noise) klasterlash algoritmi bo'lib, ma'lumotlar fazosida zich sohalarni topadi va chegaradoshlarni aniqlaydi. U raqamli va toifali ma'lumotlarni klasterlash uchun ishlatilishi mumkin [17].

DBSCAN usulining ishlash tamoyili yuqori zichlikdagi nuqtalar to'plangan sohalarni, ya'ni klasterlarni topishga asoslangan. Buning algoritm ikkita parametrdan foydalanadi: s radiusi va klaster

222

2

k

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год

hosil qilish uchun zarur bo'lgan minimal nuqtalar soni (minPts). Algoritm ma'lumotlardagi ko'rib chiqilmagan ixtiyoriy nuqtani tanlashdan boshlanadi. So'ngra, bu nuqtadan e radiusda joylashgan barcha nuqtalarni aniqlaydi. Agar ushbu sohadagi nuqtalar soni minPts ga teng yoki undan ko'p bo'lsa, bu soha klaster deb hisoblanadi. Agar nuqtalar soni minPts dan kam bo'lsa, bu nuqta tashqi qiymat sifatida qaraladi. Agar nuqtalar soni minPts dan ko'p bo'lsa-yu, ammo ular tanlangan nuqtadan s radiusli sohada joylashmagan bo'lsa, algoritm keyingi ko'rib chiqilmagan nuqtaga o'tadi va jarayonni takrorlaydi.

Birinchi klaster aniqlanganidan so'ng, algoritm ushbu klasterdan e radiusda joylashgan ma'lumotlardagi barcha nuqtalarni topadi va bu nuqtalar uchun klasterlarni qidirish jarayonini takrorlaydi. DBSCAN usulining asosiy afzalliklaridan biri shundaki, u oldindan belgilangan klasterlar sonini talab qilmaydi va ularning sonini ma'lumotlar asosida aniqlash imkoniyatiga ega. Bundan tashqari, DBSCAN usuli shovqin va tashqi ma'lumotlarni qayta ishlashi mumkin, chunki u ularni haqiqiy klasterlardan ajrata oladi.

Barcha zarur qo'shimcha tushunchalarni kiritgan holda, biz modifikatsiyalangan chegarani hisoblash algoritmini shakllantirishga o'tishimiz mumkin:

1. Spektrogramma ma'lumotlarini tayyorlash. Spektrogrammadan ma'lumotni ajratishda chastota va amplitudaga asoslangan Chastota centroidi (1) va quvvat spektrining tarqalishi (spread) (2) o'lchovlar ishlatiladi:

liffS(Ji)

Cf =

ZiS(fi)

Oi

Ш-Cf) •s(fi)

'f

(9)

(10)

ZiS(fù

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Energiyani hisoblash.

Spektrogrammaning amplituda yoki energiya ma'lumotlari S(m,k) vaqt-chastota sohasidagi belgilarni ko'rsatadi. Ushbu belgilarlar quyidagi bosqichlarda ishlatiladi:

a) Belgilarni tanlash: Har bir vaqt bo'yicha energiya profili E(m) olinadi:

K-1

E(m) = ^S(m,k)2 (11)

k=0

bu yerda К - chastota komponentlari soni, m -vaqt indeksi.

b) Normallashtirish: Zichlikni aniqlash uchun qiymatlar [0, 1] oraliqqa normallashtiriladi: E(m)- min(E)

E(m) =

(12)

max(E) - min(E) 3. DBSCAN algoritmini qo'llash. DBSCAN algoritmi har bir vaqt indeksi m uchun uning zichlikka bog'liq qo'shnilari aniqlanadi:

Ne(m) = [m'\d(m,m') < г) (13) bu yerda d(m,m') - masofa o'lchovi (Yevklid masofasi), e - radius. Ne(m) > MinPts asosiy nuqta sharti hisoblanadi.

Qo'shnilar soni \Ne(m)\ minimal chegaradan (MinPts) yuqori bo'lsa, nuqta klasterga kiritiladi. Aks holda, u shovqin sifatida belgilanishi mumkin.

5. Klasterlash va vaqt chegaralarini aniqlash. Klasterlash natijasida hosil bo'lgan klasterlar so'zlarning vaqt chegaralarini aniqlash uchun ishlatiladi. Har bir klaster uchun boshlang'ich tstart va oxirgi tend vaqt aniqlanadi. Segmentatsiyalangan so'zlar vaqt intervali [tstart,tend] sifatida belgilanadi.

6. Segmentatsiya natijasi. DBSCAN klasterlari vaqt bo'yicha davomiyligini kuzatish orqali so'zlarni ajratish mumkin. Klasterlar vaqt o'qi bo'yicha quyidagicha hosil qilinadi:

Wk = [ti\label (U) = k) (14)

bu yerda Wk - k klasterdagi vaqt segmentlari. Natijalar.

Segmentlar chegaralarini hisoblash.

Yuqorida ishlab chiqilgan nutq signali spektrogrammasini binarizatsiya qilish algoritmlaridan foydalanib, keyingi tahlil uchun yaroqli tasvirlarni olish mumkin.

223

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год

3. rasm. K-means usulida tanlangan chegaraning binarizatsiyadan keyingi spektogramma ko'rinishi

4. rasm. Noaniq c-means usulida tanlangan chegaraning binarizatsiyadan keyingi spektogramma ko'rinishi

i '} • '!. 'I , ,< I

5. rasm. DBSCAN usulida tanlangan chegaraning binarizatsiyadan keyingi spektogramma ko'rinishi

3-rasmda k-means usuli yordamida ishlov berilgan spektrogramma, 4-rasmda noaniq c-means usuli yordamida, 5-rasmda esa DBSCAN usuli yordamida ishlov berilgan spektrogramma ko'rsatilgan.

Har bir usul uchun bir qator tajribalar o'tkazildi, unda 8 xil kishidan 70 ta gap olinib, umumiy matnda 800 ta so'z bo'lgan. Natijalar 1- jadvalda keltirilgan.

1-jadval. Usullarni eksperimental qo'llash natijalari

Diktorning raqami Gaplar soni Umumiy so'zlar soni To'g'ri aniqiangan so'zlar soni va aniqlik foizi

K-means Noaniq c-means DBSCAN

# % # % # %

№1 70 800 725 90,6 721 90,1 733 91,6

№¡2 70 800 725 90,6 663 82,9 796 99,5

№¡3 70 800 726 90,8 726 90,8 810 101,3

№¡4 70 800 722 90,3 725 90,6 659 82,4

70 800 725 90,6 700 87,5 759 94,9

№¡6 70 800 730 91,3 728 91,0 658 82,3

№7 70 800 729 91,1 720 90,0 729 91,1

№8 70 800 727 90,9 729 91,1 759 94,9

Jami 560 6400 5809 90,8 5712 90,8 5903 92,2

K-means usuli uchun o'rtacha aniqlik 90,8%, noaniq c-means usuli uchun 90,8%, DBSCAN usuli uchun esa 92,2% ni tashkil qiladi. Nutq signalini segmentatsiya qilish usullari va ularning samaradorligini aniqlashda olingan natijalarni taqqoslash uchun ochiq manbalarda mavjud bo'lgan so'zlarga murojaat qilish mumkin. Yashirin Markov modellariga asoslangan yondashuv 90% to'g'ri ajratilgan so'zlar samaradorligini ko'rsatadi [18].

Xulosa. Tadqiqot natijalari avtomatik nutq segmentatsiyasi uchun qo'llanilgan K-means, noaniq c-means va DBSCAN algoritmlarining har biri o'ziga xos samaradorlik va aniqlik darajasini ko'rsatganini tasdiqlaydi. DBSCAN algoritmi yuqori aniqlik (92,2%) va shovqinlarga chidamliligi bilan ajralib turdi. Bu esa, ushbu usulni, ayniqsa, murakkab va shovqinli muhitlarda qo'llash uchun maqsadga muvofiq ekanligini ko'rsatadi. Ushbu algoritmlarning qo'llanilishi avtomatlashtirilgan nutqni qayta ishlash tizimlari, lingvistik korpus yaratish va boshqa sohalarda samaradorligini oshiradi. Natijalar yashirin Markov modellariga asoslangan usullar bilan taqqoslanganda raqobatbardosh ekanini isbotlaydi.

224

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год

Foydalanilgan adabiyotlar

1. Hioka Y., Hamada N. Voice activity detection with array signal processing in the wavelet domain // 11th European Signal Processing Conference. - 2002. - P. 1-4.

2. Cherif A., Bouafif L., Dabbabi T. Pitch Detection and Formant Analysis of Arabic Speech Processing // Applied Acoustics. -2001. - Vol. 62. - P. 1129-1140. DOI: 10.1016/S0003-682X(01)00007-X

3. Sharma M., Mammone R. Subword-based text-dependent speaker verification system with user-selectable passwords // IEEE International Conference on Acoustics, Speech and Signal Processing. - 1996. - Vol. 1. - P. 93-96. DOI: 10.1109/ICASSP.1996.540298

4. Rasanen O. Speech Segmentation and Clustering Methods for a New Speech Recognition Architecture. Helsinki University of Technology. - 2007. - P. 94.

5. Basu S. A linked-HMM model for robust voicing and speech detection // IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP'03). - 2003. -Vol. 1. - P. 816-819.

6. Rahman M., Bhuiyan A. Continuous Bangla Speech Segmentation using Short-term Speech Features Extraction Approaches // International Journal of Advanced Computer Science and Application (IJACSA). - 2012. - Vol. 3. - P. 131-138.

7. Beritelli F., Casale S. Robust voiced/unvoiced speech classification using fuzzy rules // IEEE Workshop on Speech Coding for Telecommunications. - 1997. - P. 5-6. DOI: 10.1109/SCFT.1997.623868

8. Thangarajan R., Natarajan M., Selvam M. Syllable modeling in continuous speech recognition for Tamil language // International Journal of Speech Technology. - 2009. - Vol. 12. - P. 47-57. DOI: 10.1007/s10772- 0099058-0

9. Kvale K. Segmentation and Labeling of Speech // Norwegian Institute of Technology. - 1993. -P. 271.

10. Qi Y., Hunt B. R. Voiced-unvoiced-silence classifications of speech using hybrid features and a network classifier // IEEE Transactions

on Speech and Audio Pressing. - 1993. - Vol. 1.

- P. 250-255. DOI: 10.1109/89.222883

11. Alpaydin E. Introduction to Machine Learning // MIT Press, Cambridge. - 2016. - P. 206. DOI: 10.1017/S0269888906220745

12. Hathway R.J., Bezdek J. Optimization of Clustering Criteria by Reformulation // IEEE Transaction on Fuzzy Systems. - 1995. - Vol. 3.

- P. 241-245. DOI: 10.1109/91.388178

13. Philipose S.S. A Triclass Image Segmentation using Adaptive K- means Clustering and Otsu's Method // International Journal of Engineering Research and General Science. - 2015. - Vol. 3.

- P. 134-138.

14. SaiJayram A.K.V., Ramasubramanian V., Sreenivas T.V. Robust parameters for automatic segmentation of speech // IEEE International Conference on Acoustics, Speech and Signal Processing. - 2002. - Vol. 1. - P. 513516. DOI: 10.1109/ICASSP.2002.5743767

15. Webb A. Statistical Pattern Recognition // John Wiley & Sons, New Jersey. - 2002. - P. 496. DOI: 10.1002/0470854774

16. Tan P.N., Steinbach M., Kumar V. Introduction to Data Mining // Addison-Wesley, Boston. -2005. - P. 769.

17. Kriegel H.-P., Schubert E., Zimek A. The (black) art of runtime evaluation: Are we comparing algorithms or implementations? Knowledge and Information Systems. 2016. Vol. 52.No. 2. P. 341.

18. Shanthi T., Chelpa L. Isolated word speech recognition system using HTK // International Journal of Computer Science Engineering and Information Technology Research. - 2014. -Vol. 4. - P. 81-86.

225

i Надоели баннеры? Вы всегда можете отключить рекламу.