Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
YUZ TASVIRLARIGA DASTLABKI ISHLOV BERISHDA NEYRON TARMOQ ALGORITMLARINI QO'LLASH SAMARADORLIGI
Abdukadirova Gulbahor Xomidjon qizi,
"Axborot texnologiyalari kafedrsi assistenti" Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Farg'ona
filiali
Farg'ona, O'zbekiston [email protected]
Abduqodirova Mohizoda Ilxomidin qizi,
"Axborot texnologiyalari kafedrsi assistenti" Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti Farg'ona
filiali
Farg'ona, O'zbekiston mohizoda0524ilhomidinovna@gmail .com
Annotatsiya: Yuz tasvirlariga dastlabki ishlov berish algoritmlari biometrik tizimlar, yuzni aniqlash va ifoda tahlilida muhim ahamiyat kasb etadi. Ushbu maqola yuz tasvirlarga dastlabki ishlov berish model o'qitishning eng muhim bosqichlaridan biri ekanligi hamda yuz tasvirlariga dastlabki ishlov berish neyron tarmoqni muvaffaqiyatli o'qitish va yuqori aniqlikni ta'minlash uchun muhim. Dastlabki ishlovning sifati modelning nafaqat ma'lumotlarni qayta ishlash tezligiga, balki murakkab sharoitlarda aniqlik bilan ishlashiga ham bevosita ta'sir qiladi.To'g'ri ishlov berilgan ma'lumotlar neyron tarmoqni samarali o'qitishni va yuqori aniqlikdagi natijalarga erishishni ta'minlaydi.Zamonaviy usullar tahlil qilinadi. Ushbu algoritmlar ma'lumot sifatini oshirish va keyingi ishlov berish jarayonlarini soddalashtirish imkonini beradi. Tadqiqot yuzni qayta ishlashning ilmiy asoslarini yoritib, amaliy tatbiq uchun qo'llanma sifatida xizmat qiladi.
Ka'lit so'zlar: tasvirlarga ishlov berish algoritmlari,FaceNet, SVM algoritmi, MobileNet2 neyron tarmog'i arxitekturasi, Nuqtalarni hisoblash algoritmi TensorFlow kutubxonasi, konvolyutsion neyron tarmoq (CNN).
Kirish
Yuz tasvirlariga dastlabki ishlov berish algoritmlari zamonaviy texnologiyalar va ilmiy tadqiqotlarning ajralmas qismiga aylangan. Ushbu algoritmlar biometrik tizimlar, yuzni aniqlash, ifoda tahlili, xavfsizlik tizimlari, inson-mashina interfeyslari, va hatto tibbiyot sohalarida keng qo'llaniladi. Yuz tasvirlari odatda real muhitda turli xil buzilishlar, jumladan, shovqin, yorug'lik intensivligining o'zgarishi, geometrik o'zgarishlar (burchak yoki burilish), va fon ma'lumotlari bilan birga olinadi. Bunday murakkab muhitda tasvirlarning to'g'ri ishlov berilmasligi natijani noto'g'ri talqin qilishga olib kelishi mumkin. Shu sababli, dastlabki ishlov berish
fîlsi.l^rîl
jarayoni yuzni aniqlash va tahlil qilish uchun tayyorlov bosqichi sifatida muhim o'rin tutadi.
Tasvirlarni dastlabki ishlov berish algoritmlarining asosiy vazifasi ma'lumotni soddalashtirish, tahlil qilish jarayonini tezlashtirish va aniqlikni oshirishdir. Bu jarayon tasvirni filtrlash, rangli formatdan kulrang rangga o'tkazish, shovqinni kamaytirish, geometriyani normallashtirish va ma'lum bir xususiyatlarni ajratish kabi bosqichlarni o'z ichiga oladi. Zamonaviy tadqiqotlar ushbu bosqichlarni avtomatlashtirish va optimallashtirish uchun chuqur o'rganish algoritmlaridan, jumladan, konvolyutsion neyron tarmoqlardan (CNN) foydalanishni taklif qiladi.
429
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
Yuz tasvirlariga ishlov berish faqat texnik jarayon bilan cheklanib qolmay, balki insoniy ma'lumotlarni himoya qilish va xavfsizlik talablari bilan ham bog'liq. Bu esa ushbu sohadagi tadqiqotlarni yanada dolzarb qiladi. Ayniqsa, biometrik tizimlar, masalan, yuz orqali autentifikatsiya, yuzni identifikatsiya qilish va his-tuyg'ularni tahlil qilish texnologiyalarida dastlabki ishlov berish bosqichining sifati butun tizimning ishonchliligiga bevosita ta'sir qiladi.
Tadqiqotning asosiy maqsadi ushbu usullarning afzallik va kamchiliklarini baholab, ularni amaliy tatbiqda qo'llash bo'yicha ilmiy tavsiyalarni ishlab chiqishdan iborat. Shu bilan birga, ishlov berish algoritmlarining yuz tasvirlaridagi asosiy elementlarni aniqlashga ta'siri va samaradorligi haqida xulosalar keltiriladi.
Mazkur maqolada yuz tasvirlariga dastlabki ishlov berish jarayonining bosqichlari, jumladan, tasvirlarni normallashtirish, shovqinni kamaytirish, chekka chiziqlarni aniqlash va yuzni aniqlash metodlari ko'rib chiqiladi. Ushbu jarayon keyingi ishlov berish bosqichlarini osonlashtirib, yuqori aniqlikka erishish imkonini beradi.Maqolaning asosiy maqsadi tasvirga ishlov berishning turli usullarini tahlil qilish va ularning samaradorligini amaliy misollar yordamida baholashdir. Maqola yuzni qayta ishlash algoritmlarining nafaqat nazariy, balki amaliy jihatlarini ham yoritadi.
Adabiyotlar tahlili va metodologiya
Zamonaviy tadqiqotlar chuqur o'rganish (deep learning) texnologiyalarining yuzni tahlil qilishda samaradorligini ko'rsatadi. Misol uchun, Ren va boshqalar (2015) tomonidan taklif qilingan Fast R-CNN modeli va FaceNet algoritmi yuzni aniqlash va ifodalarni tanib olishda yuqori aniqlikni ta'minlagan.[1]Ushbu yondashuvlar ko'proq hisoblash resurslarini talab qiladi, ammo ko'p qatlamli neyron tarmoqlar yordamida tasvirning murakkab xususiyatlarini o'rganishga imkon beradi.Tasvirdagi shovqinni kamaytirish uchun Davis Cope1, Barbara Blakeslee2 va Mark E. McCourt2(2013) tasvirni ishlov berish bo'yicha ushbu filtrlarning samaradorligini isbotlab, ularning tasvirning aniqligini oshirishdagi
rolini ta'kidlaydi.[2]Shuningdek, histogramni tenglashtirish texnikasi tasvir kontrastini yaxshilashda juda muhim hisoblanadi, bu esa yuzni aniqlash jarayonida sezilarli yordam beradi.Dlib va MTCNN (Multi-task Cascaded Convolutional Networks) algoritmlari so'nggi yillarda e'tibor markaziga aylangan. Zhang va boshqalar (2016) tomonidan ishlab chiqilgan MTCNN modeli ko'p bosqichli yondashuv orqali yuzni aniqlashda yuqori aniqlikka 2018-yilda Sandler et al erishadi. Ushbu model tasvirning bir nechta xususiyatlarini bir vaqtning o'zida tahlil qilishga imkon beradi, bu esa uni zamonaviy ilovalar uchun afzal qiladi.[3]
MobileNetV2 — bu kichik hisoblash quvvatiga ega qurilmalarda (mobil telefonlar, IoT qurilmalari) samarali ishlash uchun ishlab chiqilgan engil va tezkor konvolyutsion neyron tarmoq arxitekturasi. Ushbu arxitektura MobileNetVl asosida takomillashtirilgan bo'lib, samaradorlik va aniqlikni oshirish uchun bir nechta innovatsion texnikalarni qo'llaydi. MobileNetV2 arxitekturasi. tomonidan taqdim etilgan.
Tasvirlar tasnifiga asoslangan
identifikatsiyalash modelini ishlab chiqish uchun birinchi navbatda yuzlarni topish va tasvirdan ajratib olish uchun neyron tarmoq niqobli yuz detektorini sozlandi, so'ngra tasvir belgilarini chuqur neyron tarmog'iga o'tkazish orqali sinflarga ajratish uchun yuz belgilari 128 o'lchovli o'lchamga joylashtirildi. Lokal belgilar usullari ma'lum geometrik xususiyatlarga ega bo'lgan yuz xususiyatlarini aniqlash va tavsiflash uchun ishlatiladi (1-rasm).
1-rasm. Ajratlgan yuzning lokal ko'rinishli elementlari qirqib olinadi.
Yuzning niqoblangan sohasini samarali olib tashlash uchun, burchak ostida berilgan yuzni sozlash, tekislash vazifasini bajarish uchun 68 ta shakl detektordan foydalanildi. Bundan tashqari, ko'zlar,
430
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
qoshlar va yuzning o'rtasi kabi yuz xususiyatlarini aniqlash va aks ettirish uchun 24 ta maxsus belgidan foydalanilgan (2-rasm).
2-rasm. Yuzning ikki o'lchamli maxsus belgilari
Ko'rinadigan yuz belgilarini 128 o'lchamga joylashtirish uchun aniqlangan yuzlarni kesib olish kerak, buning uchun yengil va samarali hisoblangan InceptionV3 sun'iy neyron tarmoq arxitekturasi tanlab olindi. U kompyuterning ko'rishi vazifalari uchun ishlab chiqilgan TensorFlow kutubxonasi tomonidan quvvatlanadigan ochiq kodli Keras neyron tarmoq kutubxonasi yordamida yaratilgan. Yuzning maxsus nuqtalarini aniqlash uchun chuqur o'qitilgan konvolyutsion neyron tarmog'ini yaratish uchun Google tadqiqotchilari yuz tasvirini kirish ma'lumoti sifatida qabul qiluvchi va chiqish sifatida 128 o'lchamni joylashtirishi mumkin bo'lgan zamonaviy neyron tarmog'ini taqdim qilishdi. Ushbu usul tasniflash masalasini yengillashtiradi, chunki dastlabki tayyorlangan chuqur o'qitish modelidan foydalangan holda ko'plab insonlarning tasnifini solishtirish ko'p vaqt talab etadi va biz esa bu vazifani millisekundlarda bajarishimiz kerak bo'ladi. [1] ish mualliflar so'zlariga ko'ra, FaceNet tarmog'i yuz o'xshashliklariga mos keladigan maxsus nuqtalar orasidagi diapazonni hisoblash uchun chuqur o'qitilgan konvolyutsion neyron tarmog'idan foydalanadi.
FaceNet mualliflari ikki ajratilgan yuz o'rtasidagi o'xshashlikni hisoblash uchun uchlangan xatolik funksiyasidan foydalanganlar. Tarmoq uchun uchta kirish (yakor, ijobiy va salbiy obyektlar) mavjud bo'lganligi sababli, ushbu xatolik funksiyasidan foydalanishning mohiyati shundan iboratki, yakor obyekti salbiy obyektga qaraganda ijobiy obyektga nisbatan o'xshash bo'lishi kerak va ushbu solishtirishni hisoblash formulasi quyidagicha ko'rinishda bo'ladi:
C(x, y,z) = max{\\f(x) -/(v)ll2- II/(*) - f(z)\\2 + в) (1)
Bu yerda x yakor obyekti, y ijobiy obyekt va z
salbiy obyekt. f ( ) 128 o'lchamdagi tasvirni joylashtiradigan funksiyani belgilaydi. Va 0 ijobiy va salbiy qism o'rtasidagi farqni ifodalaydi, bu juft tasvirlar orasidagi farqlovchi qiymatni anglatadi. (1) formula asosida belgilarni ajratishda foydalaniladi.
Joylash (vektorga) deganda kiritilgan tasvirdan bir nechta kerakli o'lchovlarni olish va 128 o'lchamli tasvirni kodlash tushuniladi (2-rasm). Google ning FaceNet, Facebookning DeepFace va Amazonning Rekognition kabi vektorlariga yuz tasvirini kodlash uchun dastlabki o'qitilgan modellar mavjud. Ushbu modellar yuz belgilarini kodlash va ularni taqqoslash uchun o'qitilgan.
Tadqiqot ishida qo'yilgan masalani yechish uchun yuzning yuqori qismini 128 o'lchovli vektorga kodlaydigan model kerak bo'ladi. Ushbu vazifani bajarish uchun FaceNet arxitekturasi tanlab olindi. FaceNet mualliflarining ta'kidlashicha, 128 o'lchamli o'lchov, DeepFace kabi zamonaviy usullarga nisbatan yuqori aniqlikka erishish uchun yetarlidir. FaceNet modeli TensorFlow bilan OpenCV-dnn kutubxonasida yuzni aniqlash modelining chiqish hajmiga asoslangan kirish o'lchami 3*96*96 bo'lgan tasvirlar yordamida amalga oshirilgan.
Kodlash bosqichida o'rnatilgan yuz normallashtiriladi, bu boshqa diapazonda o'lchangan qiymatlarni standart o'lchamga o'tkazishni anglatadi va vektorlar normallashtirilib, turli tasniflash, regressiya va klasterlash algoritmlariga ega bo'lgan scikits-learn kutubxonasidan foydalaniladi.
3-rasm. Yuz tasvirini 128 o'lchamli vektorga
joylash.
431
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
Tasniflash masalasini yechishda o'tkazilgan tajribalarda ma'lumotlar to'plamidagi ikki sinf (niqoblangan yuzlar, niqoblanmagan yuzlar) uchun aniqlik va xatolik aniqligini solishtirish uchun turli modellardan foydalanildi. Ilmiy ishimizdagi yuzlarni tasniflash muammolari uchun asosiy klassifikator sifatida tayanch vektorlar usulidan foydalanilgan. Tayanch vektorlar usuli Korinna Kortes va Vladimir Vapnik tomonidan [2] maqolasida taqdim etilgan, bu tasniflash muammolarini hal qilishning samarali usuli hisobladi. Mualliflar boshqa ma'lumotlar to'plami bilan tajriba o'tkazish orqali tayanch vektorlar usulining samaradorligini isbotladilar.
SVM algoritmining asosiy g'oyasi optimal gipertekislikni aniqlash va chiziqli bo'lmagan ajraladigan masalalarni umumlashtirishdan iborat. ANN algoritmi bilan solishtirganda, SVM algoritmi barcha o'quv ma'lumotlarida nol xatoga erishishga harakat qilganida, o'qitish jarayonida sodir bo'luvchi o'lchovli nusxalalanish va ortiqcha o'qitish kabi jarayonlari sodir bo'lmaydi.
Tayanch vektorlar usuli ikkilik tasniflash uchun ishlab chiqilgan, shuning uchun ular o'quv ma'lumotlari va tegishli belgilar (label) asosida o'qitiladi. Test xatoligini hisoblash uchun ikkita xatolik funksiyasi qo'llaniladi, birinchisi L1-SVM deb ataladi, u zaxira o'zgaruvchilarning chiziqli yig'indisini tashkil qiladi va L2-SVM deb nomlanuvchi ikkinchi xatolik funksiyasi, zaxira o'zgaruvchilarining kvadrat yig'indisini tashkil qiladi. L2-SVM turi L1-SVM ga qaraganda samarali hisoblanadi, chunki L2-SVM differensiallanadi va chegaradan chiquvchi nuqtalar uchun katta (chiziqliga qaraganda kvadratik) xatolarga olib keladi. Matematik jihatdan, L2-SVM tenglamasi L1-SVM tenglamasining to'rtburchakli shaklidir, lekin u kvadratik xatolarini minimallashtiradi:
1 N 2
min-WXX + C Y max (l - WXX t„, 0)
w 2 ' ^ '
n=l
(2)
Bu yerda Xn - kiruvchi ma'lumotni bildiradi, tn -bashorat oralig'i £(-1,+1) va max - funksiyasi zaif kvadratlar o'zgaruvchisini bildiradi.
x
sinov
ma'lumotlarining sinf belgisini (label) bashorat qilish
arg max (wtX ) t uchun formulasidan
foydalaniladi.[4]
Tasvirdan belgi ajratish uchun u dastlab matritsa ko'rinishidagi sonlar to'plamiga (Numpi kutubxonasi yordamida) o'tkaziladi. Tasvirning integral ko'rinishi bu matritsa bo'lib, uning o'lchami dastlabki tasvirning o'lchami bilan bir xilda bo'ladi. Matritsaning komponentalari quyidagi formula asosida hisoblanadi:
i<x 1<У
ll(x,y)=Y^Ki.i) (3)
i=0j=0
bu yerda I(i,j) - berilgan tasvirning piksel yorqinligi.
II(x,y) - matritsaning har bir elementi (0, 0) dan (x, y) gacha bo'lgan to'rtburchakdagi piksellar yig'indisidir. Matritsani hisoblash tasvirdagi piksellar soniga proporsional chiziqli vaqtni talab qiladi.[5]
Yuz niqoblarini aniqlash uchun yuz tasvirlarining belgilar fazosini shakllantirish algoritmi quyida keltirilgan:
1-qadam. Tasvir kiritiladi.
2-qadam. Maxsus nuqtalarni saqlash uchun ro'yhat (sonlar to'plami) yaratiladi.
3-qadam. Kiruvchi tasvir asosida tasvirning integral ko'rinishi (3) formula asosida hisoblanadi.
4-qadam. Integral tasvirda maxsus nuqtalar qidiriladi.
5-qadam. Maxsus nuqtalar uchun deskriptorlar SIFT usuli yordamida hisoblanadi.
6-qadam. Hisoblangan deskriptorlar faylga saqlanadi.
Yuqoridagi algoritmning blok-sxemasi quyidagicha ko'rinishga ega bo'ladi:
432
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
4-rasm. Nuqtalarni hisoblash algoritmi uchun blok diagrammasi Natija
Yuz ma'lumotlari bazasini o'qitishda MobileNetV2 neyron tarmoq arxitekturasidan foydalanildi. Oddiy konvolyutsiya amali D * D * C
к k m filtrini tashkil qiladi, bu yerda Dk -konvolyutsiya yadrosining o'lchami va Cin - kirish kanallari soni. Konvolyutsion qatlamning umumiy
hisoblash
D * D * C Dk Dk Ci
murakkabligi
* г» * г» * с
Df Df Cout
ni tashkil qiladi, bu yerda Df - qatlamning balandligi va kengligi (tenzorning kirish va chiqish fazoviy o'lchamlari bir xil deb faraz qilamiz), Cout - esa chiqish kanallari soni.
Chuqur ajraladigan konvolyutsiya (depthwise separable convolution) g'oyasi bunday qatlamni kanalma-kanal filtrlardan iborat bo'lgan chuqurlikdagi (depthwise) konvolyutsiyaga va 1x1 konvolyutsiyaga (shuningdek, pointwise convolution - nuqtali konvolyutsiya deb ataladi) parchalashdan iborat. Bunday qatlamni qo'llash bo'yicha operatsiyalarning soni quyidagicha hisoblandi
(D * D + C ) *C
(Dk Dk + Cout ) Ci>
* D * D Df Df
Quyida 4-rasmning chap qismida oddiy konvolyutsion tarmoq bloki, o'ngda esa asosiy MobileNet bloki keltirilgan.
5-rasm. Oddiy konvolyutsion va MobileNetV2 neyron tarmog'i tuzilish bloklari
Tarmoqning konvolyutsion qismi boshida 3x3 konvolyutsiyali bitta oddiy konvolyutsion qatlamdan va rasmning o'ng qismida keltirilgan o'n uchta blokdan iborat bo'lib, filtrlar soni asta-sekin ortib, tensorning fazoviy o'lchami esa kamayib bordi.
Ushbu arxitekturaning o'ziga xos xususiyati max pooling (maksimal birlashma) qatlamlarining mavjud emasligidir. Buning o'rniga fazoviy o'lchamni kamaytirish uchun qadam parametri 2 ga teng bo'lgan konvolyutsiya qo'llanildi.
MobileNet arxitekturasining ikkita giperparametri a (kenglik multiplikatori) va p (chuqurlik multiplikatori yoki kenglikni ko'paytiruvchi) mavjud.
Kenglik multiplikatori har bir qatlamdagi kanallar soni uchun javobgardir. Misol uchun, a = 1 qiymat yuqorida tasvirlangan arxitekturani bersa, a = 0,25 har bir blokning chiqishida kanallar sonini to'rt baravar kamaytirilgan arxitekturani beradi.[7]
Chuqurlik multiplikatori kirish tenzorlarining fazoviy o'lchamlari uchun javobgardir. Masalan, p = 0,5 qiymati har bir qatlamga berilgan belgilar xaritasining balandligi va kengligi ikki barobarga qisqarishini bildiradi.
Ikkala parametr ham tarmoq hajmini o'zgartirishga imkon beradi: a va p ni kamaytirish orqali biz tanib olish aniqligini kamaytiramiz, lekin ayni paytda ishlash tezligini oshiramiz va xotira sarfini kamaytiramiz.[5]
MobileNetV2 — bu samaradorlikni oshirish va kam resurs talab qilishni ta'minlash uchun ishlab
433
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
chiqilgan chuqur konvolyutsion neyron tarmoq (CNN) arxitekturasi. U asosan mobil qurilmalar va past quvvatli tizimlar uchun mo'ljallangan bo'lib, klassik va zamonaviy texnikalarni birlashtiradi. MobileNetV2 o'zining samarali va yengil arxitekturasi bilan tasvirni tasniflash va boshqa kompyuter ko'rish vazifalarida keng qo'llaniladi. Teskari qoldiq bloklari va chiziqli bottleneck texnikasi tufayli bu model past quvvat talab qiluvchi qurilmalarda ishlash uchun ideal tanlovdir. MobileNetV2 neyron tarmog'i arxitekturasida mavjud qatlamlar, konvolyutsiya, chuqur konvolyutsiya, nuqtali konvolyutsiya, chuqur ajraluvchan konvolyutsiya, o'rtacha birlashma hamda belgilar xaritasining o'lchamlari quyidagi 4-rasmda keltirilgan:
5-rasm. MobileNetV2 konvolyutsion neyron tarmoq arxitekturasi
Yuqoridagi 5-rasmda MobileNetV2 neyron tarmog'ining tuzilishida kiruvchi tasvirlar 224*224 o'lchamida berilib, belgilar xaritasi 3*3 o'lchamida berilgan. So'ngra chuqur konvolyutsiya, nuqtali konvolyutsiya, chuqur ajraluvchan konvolyutsiya, global o'rtacha birlashma va to'liq bog'lanish amallari ketma-ketligi beriladi. [7]
Tadqiqot ishida qo'yilgan masalani yechishda neyron tarmoq modelini o'qitish natijasida uning samaradorlik qiymatini oshirish uchun MobileNet neyron tarmoq arxitekturasiga qo'shimcha qatlamlar qo'shilishi natijasida quyidagi arxitekturaga ega neyron tarmog'i hosil qilindi:
7-rasm. MobileNet arxitekturalari. (a) mavjud va (b) taklif etilgan MobileNet arxitekturalari
MobileNet neyron tarmog'ining "o'rtacha birlashma" qatlami o'rniga "global o'rtacha birlashma" qatlami, "to'liq bog'lanma" qatlami esa "batch normallash", "ReLu" faollashtirish funksiyasi hamda tarmoqning ortiqcha o'qitilishini oldini olish uchun "dropout" qatlamlari bilan almashtirilgan.[7] Yuqorida qo'shimcha qilingan qatlamlar neyron tarmog'ini samarali o'qitish imkonini beradi. MobileNet neyron tarmoq arxitekturasida mavjud qatlamlar, filtrlar hajmi, chuqurlik, qadamlar shuningdek sinflar soni quyidagi 1-jadvalda batafsil keltirilgan.
1- jadval. MobileNet tanasi arxitekturasi
434
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
Konvolyutsiya tnri / qadaiii FUti shakli Kirisli hajmi
Coiiv / q2 3 x 3 x 3 X 32 224 x 224 x 3
Coiiv ch / ql 3 x 3 x 32 ch 112 x 112 x 32
Coiiv / q 1 1 x 1 x 32 x 64 112 x 112 x 32
Conv ch / q2 3x3 x 64 ch 112 x 112 x 64
Conv/q1 1 x 1 x 64 x 128 56 x 56 x 64
Conv çh / q 1 3 x 3 x 128 ch 56 x 56 x 128
Conv/q1 1 x 1 x 128 x 128 56 x 56 x 128
Conv ch / q2 3 x 3 x 128 ch 56 x 56 x 128
Conv/q 1 1 x 1 x 128 x 256 28 x 28 x 128
Conv ch / ql 3 x 3 x 256 ch 28 x 28 x 256
Conv/q1 1 x 1 x 256 x 256 28 x 28 x 256
Conv ch / q2 3 x 3 x 256 ch 28 x 28 x 256
Conv/q1 1 x 1 x 256 x 512 14 x и x 256
Conv çh / ql 5x Conv / ql 3 x 3 x 512 ch 14 x 14 x 512
1 X 1 X 512 X 512 14 x 14 x 512
Conv ch / q2 3 x 3 x 512 ch 14 x 14 x 512
Conv/q1 1 x 1 x 512 x 1024 7 x 7 x 512
Conv ch / q2 3 x 3 x 1024 ch 7 x 7 x 1024
Conv/q1 1 x 1 x 1024 x 1024 7 x 7 x 1024
Avg Pool / q 1 Pool 7x7 7 x 7 x 1024
FC / ql 1024 x 1000 1 x 1 x 1024
Softmax / q 1 Klassifikator 1 x 1 x 1000
Yuz niqobini aniqlash modeli inson yuzidagi niqob bor yoki yo'qligini aniqlashga mo'ljallangan neyron tarmoqni o'qitish jarayonini ifodalaydi. Ushbu model niqobli va niqobsiz yuzlarni tasniflashda, hamda real vaqtda kameradan olingan videolarni qayta ishlashda qo'llaniladi. Neyron tarmoqni o'qitish jarayonida tasvirlarga dastlabki ishlov berish modelning aniqligi va samaradorligini ta'minlash uchun muhim ahamiyatga ega. Ushbu jarayon tasvirlarni to'g'ri formatlash, optimallashtirish va ma'lumotni tarmoq talablariga moslashtirishdan iborat. Tasvirlarga dastlabki ishlov berish model o'qitishning eng muhim bosqichlaridan biridir. [8]Yuz tasvirlariga dastlabki ishlov berish neyron tarmoqni muvaffaqiyatli o'qitish va yuqori aniqlikni ta'minlash uchun muhim bosqichdir. Dastlabki ishlovning sifati modelning nafaqat ma'lumotlarni qayta ishlash tezligiga, balki murakkab sharoitlarda aniqlik bilan ishlashiga ham bevosita ta'sir qiladi.To'g'ri ishlov berilgan ma'lumotlar neyron tarmoqni samarali o'qitishni va yuqori aniqlikdagi natijalarga erishishni ta'minlaydi. Har bir bosqichda ma'lumotlar sifati va tarmoq talablariga moslashuviga e'tibor qaratish lozim.
Neyron tarmoqni o'qitish uchun zarur bo'lgan asosiy bosqichlar quyida keltirilgan. Neyron tarmoqli yuz niqobi detektori modelini o'qitish uchun dasturni
fîlsi.l^rîl
ikki alohida bosqichga bo'lish kerak, ularning har biri 8-rasmda keltirilgan o'ziga xos bosqichga ega:
8-rasm. Yuzdagi niqobni mavjud yoki mavjud emasligini aniqlash uchun video oqimi kadrlariga ishlov berish sxemasi
Xulosa
Mazkur maqolada yuz tasvirlariga dastlabki ishlov berish jarayonining bosqichlari, jumladan, tasvirlarni normallashtirish, shovqinni kamaytirish, chekka chiziqlarni aniqlash va yuzni aniqlash metodlari ko'rib chiqiladi. Ushbu jarayon keyingi ishlov berish bosqichlarini osonlashtirib, yuqori aniqlikka erishish imkonini beradi. Ushbu ishni bajarish orqali dastlabki ishlov berish algoritmlarining amaliy natijalariga asoslangan yondashuvlar ishlab chiqiladi.[8] Tadqiqot ishida qo'yilgan masalani yechishda neyron tarmoq modelini o'qitish natijasida uning samaradorlik qiymatini oshirish uchun MobileNet neyron tarmoq arxitekturasiga qo'shimcha qatlamlar qo'shilishi natijasida yangi arxitekturaga ega neyron tarmog'i hosil qilindi:
Mazkur tadqiqot nafaqat sun'iy intellekt va kompyuter ko'rish bo'yicha tadqiqotchilar, balki real ilovalarni ishlab chiqishda ishtirok etuvchi muhandislar uchun ham dolzarb ahamiyatga ega.
Foydalanilgan adabiyotlar
1. Ren, S., He, K., Girshick, R., et al. (2015)
Faster R-CNN: Towards Real-Time Object
435
Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 4 | 2024-yil
"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 4 | 2024 year
Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 4 | 2024 год
Detection with Region Proposal Networks. Advances in Neural Information ProcessingSystems,28,91-99. https://www.scirp.org/reference/referencespap ers?referenceid=3143500
2. Davis Copel, Barbara Blakeslee2, and Mark E. Analysis of multidimensional difference-of-Gaussians filters in terms of directly observable parameters Published in final edited form as: J Opt Soc Am A Opt Image Sci Vis. 2013 May 1; 30(5): 1002-1012 https://pmc.ncbi.nlm.nih.gov/articles/PMC378 9628/
3. Xiancheng Zhang1,2, Shigeho Noda2 , Ryutaro Himeno2 va Hao Liu Cardiovascular disease-induced thermal responses during passive heat stress: an integrated computational study INTERNATIONAL JOURNAL FOR NUMERICAL METHODS IN BIOMEDICAL ENGINEERING Int. J. Numer. Meth. Biomed. Engng. (2016); e02768 Published online in Wiley Online Library (wileyonlinelibrary.com). DOI: 10.1002/cnm.2768
https://www.researchgate.net/publication/3029 56391 Zhang et al-2016-International Journal for Numerical Method s in Biomedical Engineering-2
4. Moving Medical Image Analysis to GPU Embedded Systems: Application to Brain Tumor Segmentation July 202034(2):1-14 DQI:10.1080/08839514.2020.1787678 https://www.researchgate.net/publication/3428
25010_Moving_Medical_Image_Analysis_to_GPU_E
mbedded_Systems_Application_to_Brain_Tumor_Se
gmentation
5. F. Schroff, D. Kalenichenko and J. Philbin, "FaceNet: A unified embedding for face recognition and clustering," 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2015, pp. 815-823, doi: 10.1109/CVPR.2015.7298682
6. Cortes, C., Vapnik, V. Support-vector networks. Mach Learn 20, 273-297 (1995). https://doi .org/ 10.1007/BF00994018
7. Y.Tang, Deep Learning using Linear Support Vector Machines, arXiv: Learning, 2013, 1-6 pp., url: https://doi.org/10.48550/arXiv.1306.0239
8. Abdukadirova G.X., Orifjonov B.M., Mukaramov T.T. Binoga kirishni boshqarish tizimlarida yuz niqoblarini aniqlashga bo'lgan yondashuv // Х,исоблаш ва амалий математика муаммолари, Тошкент 2022, Махсус сон №2/1(40). 5-12 б.
436