Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
IJTIMOIY TARMOQLARDA ELEKTRON MATNLI MA'LUMOTLARNI TASNIFLASHNING
NEYRON-NORAVSHAN ALGORITMI
I
I. Kirish
Xozirgi kunda ijtimoiy tarmoqlar turli ma'lumotlar almashinuvi uchun keng tarqalgan katta hajmdagi platformaga aylandi. Elektron matnli ma'lumotlarning bu o'sishi ma'lumotlarni samarali boshqarish, tahlil qilish va talqin qilish uchun jiddiy muammolarni keltirib chiqaradi. An'anaviy tasniflash algoritmlari ko'pincha norasmiy til, jargon, qisqartmalar va turli mavzular bilan ajralib turadigan ijtimoiy media matniga xos bo'lgan murakkablik va nuanslarni hal qilishdagi muammoli holatlarda samarasiz bo'lishi kuzatilmoqda.
Ushbu muammolarni hal qilish uchun tadqiqotchilar turli xil hisoblash paradigmalarining kuchli tomonlarini birlashtirgan gibrid yondashuvlarga tobora ko'proq murojaat qilmoqdalar. Bunday yondashuvlardan biri neyron-noravshan algoritmlari bo'lib, u neyron tarmoqlarning ma'lumotlardan o'rganish qobiliyatini noravshan mantiqning sust shakllanlik va noravshanlik bilan ishlash qobiliyatini birlashtiradi [1-4]. Ushbu gibrid usul neyron tarmoqlarning moslashuvchan o'rganish
imkoniyatlaridan va noravshan tizimlarning talqin qilinishidan foydalangan holda elektron matn
Turakulov Otabek Xolmirzayevich,
Toshkent menejment va iqtisodiyot instituti, PhD [email protected]
Mamaraufov Odil Abdixamitovich,
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Samarqand filiali, PhD odil.mamaraufov@gmail .com
ma'lumotlarini tasniflash uchun mustahkam asosni taklif qiladi.
Ushbu maqolada ijtimoiy tarmoqlarda elektron matn ma'lumotlarini tasniflash uchun neyron-noravshan algoritmini ishlab chiqish va qo'llash masalasi qaralgan. Ushbu ikkita kuchli texnikani birlashtirib, tavsiya etilgan algoritm tasniflash aniqligini yaxshilash va ijtimoiy media mazmunini yanada nozikroq tushunishni ta'minlashga qaratilgan. Ishda neyron-noravshan tizimning arxitekturasini ko'rib chiqamiz, o'qitish va tasdiqlash uchun qo'llaniladigan metodologiyalar tahlil qilinadi va real ijtimoiy tarmoq ma'lumotlar to'plamidan foydalangan holda algoritm ishlashi baholalanadi.
Ushbu tadqiqotning ahamiyati uning mazmunini yanada samarali va aniq filtrlash, his-tuyg'ularni tahlil qilish va mavzuni aniqlash imkonini beruvchi avtomatlashtirilgan matn tasnifini yaxshilash bilan izohlanadi. Ijtimoiy tarmoqlarning ta'siri va murakkabligi o'sishda davom etar ekan, neyron-ravshan tizim kabi ilg'or tasniflash algoritmlari ulardagi keng ma'lumotlardan foydalanish va amaliy tushunchalarni olish uchun juda muhim bo'ladi.
II. Metodologiya
366
Annotatsiya: Ishda matnli ma'lumotlarni tahlil qilish, tasniflashda ma'lumotlarni intellektual tahlillash model va algoritmlarini ishlab chiqish masalasi qaralgan. Ishlab chiqilgan usul va modellar yordamida ijtimoiy tarmoq yozishmalarini tasniflash, uning hissiy aloqadorligini aniqlash hamda baholash masalalarini yechishda qo'llaniladi. Neyron to'rlarni qo'llash uchun kaskadli neyro-noravshan tasniflagichning guruhlashtirish tuzilmasi ishlab chiqilgan. Ijtimoiy tarmoqlardagi (o'zbek tilidagi matnlarni) tahlillash uchun tasniflash algoritmi ishlab chiqilgan bo'lib, uning yordamida ruknlashtirish, tezaruslarni amalga oshirish vositalari taklifi bayon qilingan.
Kalit so'zlar: ijtimoit tarmoq matnlari, neyro-noravshan tasniflagich, hissiyotlarni tahlil qilish, hissiylik bahosi, tezaurus, matnni tasniflash mexanizmi, LSTM neyron tarmog'i
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
Matnli ma'lumotlarni belgilarni qisqartirish semantik tahlillagich (gap tuzilmasini aniqlashda), o'zaklash, lug'at bo'yicha qidirish, guruhlashtirish, hissiyotlarni tahlillash mexanizmlari shakllantirildi. Mazkur mexanizmlar bilan qurollangan holda matnli ma'lumotlarni, aynan, ijtimoiy tarmoqda matnli ma'lumotlarni tasniflash uchun mahsus mexanizmni ishlab chiqish talab etiladi [5].
Ushbu talab asosida ijtimoiy tarmoq qisqa kontekstli matnli yozishmalari matnlarini tahlillash uchun neyro-noravshan tasniflagichni qurib olamiz. Buning uchun bu tasniflagichni vazn koeffitsiyentini qo'llagan holda rukn so'z tezauruslarining qiymatliligini hisoblab chiqiladi hamda neyro-noravshan tasniflagichdan foydalangan holda o'qitib olishni tashkil etishga xizmat qiluvchi algoritm ishlab chiqildi [6]. Ushbu algoritm quyidagi qadamlardan iborat:
1-qadam. R -ruknlar to'plami va K^-o'quv tanlanma shakllantirilib olinadi.
2-qadam. Dastlabki qiymatlarni e'lon qilish b = 1; j = 1 va b < В shartga tekshirish. Agar qiymat qiymatlar sohasi maksimumdan kichik bo'lsa o'qitish va natijaga, aks holda so'z tezaurusi lb = 1 va mj = 1 matrisa dastlabki qiymati shakllantiriladi.
3-qadam. lb<Lb tezaurus maksimumdan kichik bo'lsa, 5-qadamga, aks holda 4-qadamga o'tiladi.
5-qadam. O'quv tanlanmadan (Vib,Uib ) juftlik tanlanadi.
6-qadam. VibORj tezaurusga qo'shilgan bo'lsa, lb = lb+i bilan 3-qadamga aks holda Vib ning matnli hujjatning boshqa qismlarida uchrash chastotasini V(ot) asosida berilgan ruknni hisoblash.
7-qadam. Uchrashi nolga teng bo'lganda, so'z Wmj vazn koefisenti bilan tezaurusga qo'shiladi, aks holda ß- ekspert cheklov qiymatiga solishtiriladi. Qiymat ß-dan kichik bo'lmasa Vib-so'z tezaurusga rmj = vrr koefisiyent bilan qo'shiladi.
8-qadam. I ning navbatdagi b + 1 qiymati hosil qilinib, uning keyingi ruknga tegishliligiga tekshiriladi. Tegishli bo'lsa, y-qiymat bir birlik oshiriladi va 2-qadamga o'tiladi, aks holda qiymat qo'shilmasdan 2-qadamga o'tiladi.
9-qadam. Vib - tezaurusga rmj = rcm koefisiyent bilan qo'shiladi.
10-qadam. Tezaurusga ma'lum qiymatlarda qo'shilgan so'zlar massivi hosil qilinadi va 5- qadamga o'tiladi. 3-qadam qayta tekshirilib,
11-qadam. 2-qadam sharti qanoatlantirsa, natija chop etiladi.
Ushbu algoritm yordamida so'zlarni rukndagi vazn koeffisiyentini hisoblash amalga oshiriladi.
1-rasmda LSTM ko'rinishdagi neyron tarmog'i yordamida ruknlashtirishni amalga oshirish algoritmi keltirilgan. Mazkur algoritmni amalga oshiramiz ijtimoiy tarmoqdan olingan so'z ruknga ajratish yoki yangisini hosil qilish uchun keltirilgan belgilanishlar quyidagicha amalga oshiriladi:
K- joriy vazn miqdori, Sj- topilgan so'zlar miqdori, j-joriy qiymat, ц- rukn lug'atidagi so'z miqdori; Wi -joriy vazn koeffitsiyenti; -kiruvchi matn so'zlari.
1-rasm. LSTM yordamida ruknlashtirish algoritmi
367
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
LSTM ni tasavvur qilish uchun rekurrent neyron tarmoq bilan solishtirma ko'rinishiga keltirish mumkin:
t
t
t
t
t
A A A A A
t I î t t
Xq -fj A" 2 X^
2-rasm. Oddiy rekurrent neyron tarmog'i
2-rasmda A neyron tarmog'i, x - kiruvchi signal, h- chiqariluvchi qiymat (natija). Ko'rib turilganidek har-bir qatlam yoki birlik alohida natijadorlikka ega bo'lishi mumkin. Natijadorlikda siklni hosil qilgan holda olingan rekurrent tarmoq quyidagi ko'rinishda bo'ladi.
3-rasm. Oddiy rekurrent neyron tarmoqda siklni yo'lga qo'yish
Oddiy takrorlanuvchi rekurrent neyron tarmog'ida bitta qatlam bo'ladi. Mazkur arxitekturadan kelib chiqqan holda ijtimoiy tarmoq yozishmalarini tahlillash algoritmi yordamida matn mazmunini va yo'nalishini aniqlash amalga oshiriladi.
4-rasm. Oddiy takrorlanuvchi modulli rekurrent neyron tarmog'i
5-rasm. Takrorlanuvchi LSTM neyron tarmog'ida qatlamlarning o'zaro aloqadorligi
6-rasmda API olingan ijtimoiy tarmoqdan jamlangan matnli yozuvlar (postlar) olinadi, o'quv tanlanma shakllantiriladi. Buning uchun ishlab chiqilgan lug'atdan foydalaniladi. Word2 ves va mos ravishda TF-IDF modeli yordamida dastlabki ishlov beriladi [7]. Neyron o'qitilib, matnning tegishlilik darajasi chiqariladi.
6-rasm. Matn tuslanishiga qarab tasniflash
j arayoni
368
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
Qo'yilgan masalani yechishning keyingi bosqichida LSTM dan oldin konvolyusion qatlam belgilarni ajratib bersa, LSTM ajratilgan belgilar bilan ishlaydi.
Uning arxitekturasi quyidagi (7-rasm) ko'rinishida bo'ladi:
7-rasm. Konvolyusion va rekurrent qatlamli neyron tarmoq arxitekturasi
Uning algoritmik ko'rinishi quyidagi ko'rinishda amalga oshiriladi (8-rasm).
8-rasm. LSTM yordamida matnlarni tasniflash algoritmi
Neyron to'rlarni qo'llash uchun kaskadli neyro-noravshan tasniflagichning guruhlashtirish tuzilmasi ishlab chiqilgan. Tahlillash mexanizmining bunday tashkillashtirilishi matnlarni mazmunan tahlillashda qo'l kelishi muallif tomonidan ishlab chiqilgan yondashuv bilan asoslangan.
III. Natijalar
Ijtimoiy tarmoqdan olingan sharhlar tahlili 9-rasmdagi ko'rinishda baholangan. Mazkur sharhlar ijtimoiy tarmoqlarda fikrlashish uchun olib borilgan yozishmalardan olingan bo'lib, har bir yozuv bitta qatorni ifodalagan. Ko'rinib turibdiki, ushbu sharhlar negativ, neytral hamda pozitiv ko'rinishlarda baholangan (mos ravishda vaznlari keltirilgan) va umumiy sharh qiymati keltirib chiqarilgan. Sharhlar bahosiga qarab, uni bildirayotgan shahsning ijtimoiy tarmoqdagi o'zini tutish tarixi shakllantiriladi va foydalanuvchi ko'rsatkichlari bo'yicha diagnostika qilinadi.
Id rieg neu pos
0 1 0.000 0.695 0.305
1 2 0.13В 0.В52 0.000
2 3 0.091 0.754 0.155
3 4 0.000 1.000 0.000
4 5 0.000 0.552 0.443
5 6 0.029 0,ВОЗ 0.163
6 7 0.034 0.693 0.273
7 В 0.000 0.520 0.4 ВО
8 9 0.000 0.В51 0.149
9 10 0.000 0.705 0.295
10 11 0.017 0.В46 0.137
11 12 0.113 0.BS7 0.000
12 13 0.031 0.923 0.046 9-rasm. Turli sharhlar
ko'rsatkichlar.
compound
0.9441
-0.5664
0.B265
0.0000
0.946S
0.B330
0.9346
0.94B7
0.6369
0.B313
0.9746
-0.7579
0.2960 uchun olingan
Olib borilgan kuzatishlar shaxsning holatining o'zgarish trayektoriyasini belgilab olish imkoni berildi. Ba'zi hollarda umumlashtirilgan baho chiqarilishi talab etiladi. Bunday hollarda gistogramma ko'rinishdagi yechimlar taklif etildi. Natijalarni kuzatganimizda umumlashgan ko'rinishda ijobiy so'zlar tahlili, salbiy so'zlar tahlili hamda betaraflik holatlari aniqlangan. O'tkazilgan tajribaviy tadqiqotlar natijasida 5 ballik tizimda baholangan so'zlarning joylashuvni
369
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
vizuallashtirish orqali berilgan sharxlar matnlarida hissiy so'zlarning taqsimotini baholash mumkin.
Taklif etilgan va mavjud algoritmlar asosida o'tkazilgan tajribaviy tadqiqot natijalari matnli ma'lumotlarga dastlabki ishlov berish va tasniflash masalalarini yechishda qarab o'tilgan. Tajriba sifatida olingan matnli hujjatlarni tasniflashga ketadigan vaqt 20-25% ga qisqartirish va tasniflash aniqligini 10-17% ga oshirish imkonini berdi.
IV. Xulosa
Ushbu ishda matnli ma'lumotlarni tasniflash va tahlillashning turli yondashuvlari va ularning umumlashtirilgan arxitekturasi ishlab chiqildi va quyidagilarda o'z aksini topgan:
Matnlarni tasniflash hozirgi kunda keng quloch yozib borayotgan ijtimoiy tarmoqda matnli ma'lumotlarni tahlillash uchun asosiy mexanizmni shakllantirish usul va vositalari ishlab chiqilgan bo'lib, umumlashgan amalga oshirish mexanizmi taklif etilgan. Mazkur mexanizm yordamida matnli yozishma elementlarini konteksli tahlillash, hissiy ajratish mexanizmi tavsifini amalga oishrish yondashuvlari bayon etilgan.
Ijtimoiy tarmoqlardagi (o'zbek tilidagi matnlarni) tahlillash uchun tasniflash algoritmi ishlab chiqilgan bo'lib, uning yordamida ruknlashtirish, tezaruslarni amalga oshirish vositalari taklifi bayon qilingan. Buning uchun LSTM yordamida ruknlashtirish algoritmi taklif etilgan.
Matnlarni tahlilash samaradorligini oshirish uchun rekurrent neyron tarmog'i elementlari to'liq tashkil etib olish imkonini beruvchi algoritm ishlab chiqildi. Mazkur algoritm yordamida neyron tarmog'i o'qitilishi samaradorligi oshirilishi ko'rsatib o'tilgan. Ishlanmalar asosida konvolyusion va rekurrent qatlamli neyron tarmoq arxitekturasi taklif etildi. Mazkur arxitekturaga asoslangan LSTM yordamida matnlarni tasniflash algoritmi ishlab chiqildi va asoslab berildi.
Foydalanilgan adabiyotlar
1. Bifet, A., Holmes, G., Kirkby, R., &
Pfahringer, B. (2010). "MOA: Massive Online
Analysis". Journal of Machine Learning Research, 11, 1601-1604.
2. Nguyen, H. T., & Prasad, N. R. (1999). Fuzzy Modeling and Control: Selected Works of M. Sugeno. CRC Press.
3. Yusupbekov N.R. Boshqarishning intellektual tizimlari va qaror qabul qilish./N.R.Yusupbekov va boshqalar. -Toshkent: "O'zbekiston milliy ensiklopediyasi" Davlat ilmiy nashriyoti, 2015. -572 b.
4. Ротштейн О.П. Интеллектуальные технологии идентификации: нечеткие множества, генетические алгоритмы, нейронные сети. -Винница: «УН1ВЕРСУМ-Вшниця», 1999. -120 с.
5. H.Elghazel, A.Aussem, O.Gharroudi, and W.Saadaoui, "Ensemble multi-label text categorization based on rotation forest and latent semantic indexing," Expert Systems with Applications, vol. 57, pp. 1-11, 2016, doi: 10.1016/j.eswa.2016.03.041.
6. O.J.Babomuradov, O.X.Turakulov "Klassifkasiya masalalarni yechishda noravshan - to'plamli yondoshuv orqali yechishning tizimli tahlili" Innovatsion g'oyalar, texnologiya va loyihalarni ishlab chiqarishga tadbiq etish muammolari nomli IV-Resp.-konf.to'plami, Jizzax, 11-12 may 2012 y., 92-94 b.
O.J.Babomuradov., O.X.Turakulov "Matnli ma lumotlarni tahlillashda dastlabki ishlov berish mexanizmi" Innovation In The Modern Education System Part 36 December 2023 Colletions Of Scientific Works Washington, USA 25th December 2023. 229-p.
370