Научная статья на тему 'РАЗРАБОТКА ПРОГРАММНОГО ПРОДУКТА ДЛЯ ОБЕСПЕЧЕНИЯ КОМПЛЕКСНОЙ РАБОТЫ ГЕНЕРАТИВНЫХ МОДЕЛЕЙ НЕЙРОННЫХ СЕТЕЙ'

РАЗРАБОТКА ПРОГРАММНОГО ПРОДУКТА ДЛЯ ОБЕСПЕЧЕНИЯ КОМПЛЕКСНОЙ РАБОТЫ ГЕНЕРАТИВНЫХ МОДЕЛЕЙ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нейронные сети / искусственный интеллект / комплексная работа / генеративная модель / запрос / neural networks / artificial intelligence / complex operation / generative models / request

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Панамарева Олеся Николаевна, Муравьёв Андрей Геннадьевич, Квасов Михаил Николаевич

Нейронные сети позволяют создавать новые уникальные тексты, изображения, музыку, но для хорошего результата их работы нужен качественный запрос, составление которого для обычного пользователя может быть затруднительным. Поэтому вопросы о разработке сервиса, объединяющего в себе генерацию изображений и генеративную корректировку запроса, о его автоматизации, являются актуальными. В работе раскрыты особенности использования генеративных нейронных сетей для создания изображений по запросу пользователя. Разработан программный продукт, в основу которого положены модели генеративных нейронных сетей Kandinsky 2.2 и переобученная gpt-neo, использован язык Python 3.11, комплекс библиотек. Экспериментальное исследование подтвердило эффективность последнего.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Панамарева Олеся Николаевна, Муравьёв Андрей Геннадьевич, Квасов Михаил Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF A SOFTWARE PRODUCT FOR ENSURE THE INTEGRATED OPERATION OF GENERATIVE MODELS OF NEURAL NETWORKS

Neural networks allow us to create new unique texts, images, music, but for a good result of their work we need a high-quality request, the preparation of which can be difficult for an ordinary. Therefore, the questions of developing a service that combines image generation and generative query improvement, and its automation, are relevant. The paper reveals the features of using generative neural networks to create images at the user's request. The essence of the developed software product is described. It is based on models of generative neural networks Kandinsky 2.2 and retraining gpt-neo. The programming language Python 3.11 and a set of libraries are used to it. An experimental study confirmed the effectiveness of this software product.

Текст научной работы на тему «РАЗРАБОТКА ПРОГРАММНОГО ПРОДУКТА ДЛЯ ОБЕСПЕЧЕНИЯ КОМПЛЕКСНОЙ РАБОТЫ ГЕНЕРАТИВНЫХ МОДЕЛЕЙ НЕЙРОННЫХ СЕТЕЙ»

МА ТЕМА ТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ, КОМПЛЕКСОВ И КОМПЬЮТЕРНЫХ СЕТЕЙ

УДК 004.8: 004.4415: 681.51

DOI: 10.24412/2071-6168-2024-12-453-454

РАЗРАБОТКА ПРОГРАММНОГО ПРОДУКТА ДЛЯ ОБЕСПЕЧЕНИЯ КОМПЛЕКСНОЙ РАБОТЫ ГЕНЕРАТИВНЫХ МОДЕЛЕЙ НЕЙРОННЫХ СЕТЕЙ

О.Н. Панамарева, А.Г. Муравьёв, М.Н. Квасов

Нейронные сети позволяют создавать новые уникальные тексты, изображения, музыку, но для хорошего результата их работы нужен качественный запрос, составление которого для обычного пользователя может быть затруднительным. Поэтому вопросы о разработке сервиса, объединяющего в себе генерацию изображений и генеративную корректировку запроса, о его автоматизации, являются актуальными. В работе раскрыты особенности использования генеративных нейронных сетей для создания изображений по запросу пользователя. Разработан программный продукт, в основу которого положены модели генеративных нейронных сетей Kandinsky 2.2 и переобученная gpt-neo, использован язык Python 3.11, комплекс библиотек. Экспериментальное исследование подтвердило эффективность последнего.

Ключевые слова: нейронные сети, искусственный интеллект, комплексная работа, генеративная модель,

запрос.

Вопросам разработки, применения и развития технологий искусственного интеллекта (ИИ) последние годы уделяется большое внимание и практиками, и научными деятелями, и руководителями разного уровня управления, при этом также разработан целый комплекс нормативно-правовых актов, регламентирующих данную область [1 - 9]. Несмотря на высокий уровень интереса к данной проблематике, ее разработка в начале пути, особенно это явно стало прослеживаться в условиях санкций, военно-политических мер, принимаемых недружественными государствами, направленных в отношении России, нацеленных на недопущение формирования, обеспечения, сохранение ее технологического и экономического суверенитета. Технологии ИИ демонстрируют высокую эффективность, когда необходимо обрабатывать большие объемы (в т.ч. и разрозненных) данных в сжатые сроки, формировать из них последующую базу для анализа и повышения эффективности принятия управленческих решений человеком (лицом, принимающим решение), а также где приходится сталкиваться с нехваткой человеческих ресурсов и/или необходимостью обеспечения защиты здоровья и жизнедеятельности человека. Поэтому все вопросы, связанные с созданием, развитием, применением технологий ИИ сохраняют актуальность.

Генеративный искусственный интеллект - стремительно развивающаяся технология [10], получающая огромное количество как одобрительных отзывов, так и радикально отрицательных [11]. Так, благодаря этой технологии дизайнеры утрачивают большую часть своих навыков, потребность в обладании ими специфическими навыками сводится к минимуму, а крупные корпорации получают существенную экономию в результате сокращения расходов на высокооплачиваемый труд художников (дизайнеров) [12]. При этом генеративный искусственный интеллект позволяет абсолютно каждому человеку, имеющему доступ к персональному компьютеру или выходу в Интернет, создавать любое изображение, не зависимо от художественного образования или навыков рисования. Кроме этого данная технология значительно облегчает работу художникам, помогая делать рутинную работу [13]. Однако используя генеративный искусственный интеллект можно столкнуться со сложностями, например, для получения качественного изображения требуется детально и правильно прописанный запрос. Существует большое количество рекомендаций о том, как правильно составлять запросы для генеративного искусственного интеллекта. Эти меры носят разрозненный характер, им не присуща комплексность, при этом они реализуются чаще всего ручным способом; при том что процесс составления запроса можно автоматизировать. Однако на сегодня именно в этой области существуют пробелы.

В настоящее время нет сервисов, объединяющих в себе генерацию изображений и генеративное улучшение запроса, они представлены лишь как отдельные сервисы от разных компаний-разработчиков, например, популярный российский сервис для генерации изображений - Fusionbrain - или его иностранный аналог - Midjourney -позволяют создать изображение по нескольким основным параметрам:

- prompt (описание ожидаемого изображения);

- negative prompt (описание того, что не должно присутствовать в изображении).

В качестве примера корректировки запроса можно привести сервис neural frames, позволяющий преобразовать исходный пользовательский текст в качественный запрос для нейронной сети для генерации изображений.

Основной проблемой использования описанных инструментов является необходимость постоянного подключения к сети, а также то, что некоторые из этих сервисов требуют обязательную авторизацию перед использованием.

В целях нивелирования существующих недостатков использования вышеописанных инструментов далее описаны особенности разработки программного продукта для обеспечения комплексной работы генеративных нейронных сетей по генерации запроса и изображения, а также результаты его реализации.

Таким образом, для улучшения опыта использования генеративных нейронных сетей необходимо разработать программу с оконным пользовательским интерфейсом, объединяющим в себе несколько генеративных моделей для корректировки запроса и создания изображения по этому запросу.

Для разработки программы использовался язык высокого уровня Python 3.11 и его библиотеки, сведенные ниже в таблицу.

Перечень использованных библиотек при разработке программы, обеспечивающей комплексную работу __нейронных сетей_

Название библиотеки Описание

1 Customtkinter Предназначена для создания оконного пользовательского интерфейса

2 PIL Предназначена для корректной обработки изображения

3 Threading Предназначена для многопоточной работы программы

4 Transformers Предназначена для простого использования обученных моделей нейронных сетей

5 Kandinsky2 Предназначена для генерации изображений

Так же в программу была добавлена возможность чтения j'son-файлов для обеспечения удобной автоматической генерации большого количества изображений. Кроме того, в первую очередь был создан пользовательский интерфейс (рис. 1).

EI

Рис. 1. Пользовательский интерфейс программы генерации изображений

В окне разработанной программы расположены три раздела:

- первый раздел - отображение /son-файла;

- второй раздел - настройка параметров изображения;

- третий раздел - сгенерированное изображение (изначально отображается placeholder, т.е. заполнитель). На рис. 2 - 3 представлены фрагменты исходного кода для создания раздела отображения /son-файла.

seir.frame data = ctk.CTkFrame(self, widtb^SSO, li.iuhl SCO)

seir.dlsplay_area = rtk.CTkTextbox(i>e]f.fraine_ilata, wrap='ivonr, fonl=('Helvetica', IS), lteight=SM) 5elf.dl5play_area.giid(r(tivH), column—0, slicky-"it5eiY")

self.btn frame = ctk.CTkFraine(seir.frame (lata)

vlf.litu fi HUH' iit ill trow 1, columii=0, stick) "imii" pttdx=10, padj lUi self.data_view_grid_configurateO

self.prev button = ctk.CTkButton{self.btn frame, tfit "IIред ', I II11III:1 "I. vf1111,1 f fli'lib illnI ('Helvetica1, 14, 'bold')! seir.prpv biittoii.gi'id(i'mv=0, column it. sticky-"usew", padi=5)

self.openbultoii = .I..-I I litlutl'ij>t'lf. ilLi frame. 1е11="Открыть JSOV, command sel£opeii file, tool \ H111 с1кн'. 14, 'bold'))

self-Open bmtoo-grid(row=0, I lirnillII I, stifk)^"osew", |i.nl\ 5)

seir.uextbiitttm = ctk.CrkButttiii4lf.t'ti] flume. text="C,iea,". tuiiiiutiid silf.liuicl lion, four ('Helvetica', 14, 'bold')) self.uext_bulton.grid(iow=t>. i "111:1111" 2. v I inky- " imiv". pads

self.gett prompt button = ctk CTkBqttou(self.btn frame, 1ех|="Д11Тогеверация", foiit=('Helvetica', 10, 'bold'), rg_color='red\ hover_ctilor=rdarkred', rciiii]iiand=self.aiito_gen_cllck)

s-.'lf."i'ii pi'iiiii|)l luill(iii.|trkl(itiM' 0. column 3. sticky="usew". padi=5)

Начало

Рис. 2. Фрагмент исходного кода для отображения json-файла (начало)

454

self.stop_generation_button = ctk.CTkButton(self.btn_frame, 1ехТ='Оггяновить генерацию', font=('Helvrtica', 10, 'bold1), fg_coIor='red', hover_coIor='daikred', eommand=self.end_genevation)

self.slop_generallon_bunon.gild(ro'w=0, tolumn=4, stkky="nsew", padx=5)

self.btii_frame.grkl_coluiimconfigure(0, weight=l) self.blu_fi-aiue.grid_roluiiiticoufigure(l, weighf=l) self.btn_frame.giid_cohimnconflgure(2, welght=l) self.blii_rraiiie.grid_rohiiiiiicoufigure(3, Wtight=l) self.bhifiii[in.giidrohiiiiiifoiifigiiip(4, weight=l) se]f.btnfraiiie.gildrowconflgiire(0, weight=l)

self.jsondala = |] self.curi¥nt_index = 0

def open _fi]e(self):

filepatb = filedialog.askopenfilei]anie(fiIetypes=[("JSO?¿ files", "".json")]) if filejpath: with open (file path, 'r') as file; try:

self.parent.getjson file iiaine(Palh(file patli).slejii) self.json data = json.Ioad(flle) self.json data = self,json data['items'] self.currentindes = 0 return self.displav jsonO except Exception as e: messagebox.shoTverroif'EiTor", f'Could not load JSON data: {e}")

Окончание

Рис. 3. Фрагмент исходного кода для отображения json-файла (окончание)

На рис. 4 - 5 продемонстрирован фрагмент исходного кода для отображения раздела настройки параметров изображения.

se If.fr л ni esettings = ctk.CTkFrame(self)

seIf.prompt_label = ctk.CTkLabel(self,frame_settings, text="Prompt:") «►elf.prompt_label.grid(ro\v=0, column=0, paris=10, pady=(5, 0), sticky="w")

self.prompt_input = ctkXTkTextbox(self.frame_settiügs, width=600, height=80, font=("Helvetica", 12), border_\vidth=l, border_color='gray')

$elf.prompt_input.grid(row=0, column=l, rowspan=2, coIumnspan=2, padx=10, pad\-5, sticky='ewr)

self.negative_prompt_label = ctk.CTkLabel(self.frame_settings, text="Negative Prompt:") self.negative_]>rompt_Iabel.grid(row=3, column=0, padx=10, pady=(53 0), sticky="w")

self.negative_prompt_inpul = ctk.CTkTextbox(self.frame_setlings, width=600, height=S0, font=("HeIvetica", 12), border_width=l, border_color='gray')

self.uegative_prompt_input.grid(row=3, column=l, rowspan=2, coIutnnspan=2, padx=10, pady=5, sticky="ew")

self.width_label = ctk.CTkLabel(self.frame_settings, text=" Width:") self.width_label.grid(row=5, column=0, padx=10, pady=(5,0), sticky="w")

Начало

Рис. 4. Фрагмент исходного кода для отображения настройки параметров изображения (начало)

self.width_input = ctk.CTkEntry(self.frame_settings, width=100, font=("Helvetica", 12), border_width=l, border_color='gray')

self.width_input.insert(0,1024)

self.\vidth_input.grid(row=5, column=l, rowspan=2, padx=10, pady=5, sticky="w")

self.height_Label = ctk.CTkLabel(self.frame_settings, text="IIeight:") self.height_label.grid(row=7, column=0, padx=10, pady=(5, 0), sticky="w,r)

self.height_input = ctk.CTkEntry(self.franie_settings, width=l00, font={"Helvetica", 12), border_width=l, border_color='gray')

self.lieight_input.insert((>, 768)

self.height_input.grid(ro,w=7, column=l, rowspan=2, padx=10, pady=5, stick}—"w")

self.handIe_upgrade_button = ctk.CTkButton(self.frame_settings, te xt= 'Улуч ш ить prompt', fg_color='orange', hover_color='darkorange', command=self.handle_upgrade_prompt) self.handle_upgrade_button.grid(row=5, column=2, padx=10, pady=(5, 0), sticky='ew')

self.handle_geneLate_buttoti = ctk.CTkButton(self.frame_settings, text='CreHepiipoBaTb\ fg_color='orange', hover_color='darkorange', command=self.haiidle_generate_iitiage)

self.handIe_generate_button.grid(row=7, column=2, padx=10, pady=(5, 0), sticky='ew')

Окончание

Рис. 5. Фрагмент исходного кода для отображения настройки параметров изображения (окончание)

На рис. 6 представлен исходный код для отображения сгенерированного изображения. После этого была добавлена логика работы программного обеспечения. Для этого были созданы методы открытия файла в формате json, который обязательно должен содержать элемент «items» и методы для порядкового отображения вложенных элементов (рис. 7).

self.frame_image = ctk.CTkFrame(self, width=1200, height=800) self.setimage('placeholder.png')

def set_image(self, name): image = Image.open(name) photo = ImageTk.PhotoImage(image) image.resize(sel£.check_image_size(image))

Label = ctk.CTkLabel(seIf.frame image, image=photo, >vidth=image.\vidth, height=image.height, text=") label.image = photo

label.place(relx=0.5, rely=0.5, anchor=ctk.CENTER)

Рис. 6. Исходный код для отображения сгенерированного изображения

tief apeufile(seli):

flle_path = filedialog.asliopenflleuame(filetypes-[("JSON files", "\Json")]) if llle_path: with open(füe_path, 'r') as flic: try:

self.parfiit.get_json_l11e_naiiie(Path(filejpalh).sleni) self.jsoudala = jsou.load(file) self.json data = self.jsou data ['items'] self.current Judex = 0 return self.display_Json() except Exception as e: messagebox.showerror{"Error", F'Could not load JSON data: {e}")

def display_json(self): if self.json_data:

self.jsonstring = jsou.dunips(self,jsou data[self.current index], indent=4) return self.Json_string

def load_previous(self): if self.jsou dala and self.current index > 0: self.current_iudex -= 1 return self.display_json()

def loadnext(self): if self.jsondata aud seif, curreutindex < len(self.json data) -1: self.current_index += 1 return self, display J son()

Puc. 7. Исходный код методов для работы с json-файлом

Далее был разработан функционал генерации изображений. Для этого использовалась модель нейронной сети Kandinsky 2.2 (рис. 8), поскольку она является отечественной и ее применение демонстрирует хорошие результаты [14].

self.model = get_kandinsky2('cuda', task_type=,text2img!, mode]_version=,2.2') image = self.model.generate_text2img(

prompt=self.prompt_input.get(t,O.Ot% "end"), w=self.nearest_multiple_of_eight(int(self.width_input.get{))), h=self.nearest_multiple_of_eight(int(self.height_input.get0))5 decode rstep s=6 0 )[0]

from IPython.display import display

display(image)

if not blsHandle:

if not os.path.exists(self.ImageFolderBase):

os.mkdir(self.ImageFoiderBase) image.saveff'{filename}") else:

image.save(f'Handle lmages/{filenaine}")

Рис. 8. Исходный код использования модели нейронной сети Kandinsky 2.2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Альтернативой для модели Kandinsky 2.2 является открытая модель Stable Diffusion 1.5, однако она генерирует менее качественный результат и чувствительна к отрицательному запросу, в качестве преимущества можно выделить возможность генерации изображений большего разрешения.

На описанном выше этапе программу уже можно было использовать для генерации изображений, однако корректный запрос необходимо составлять вручную. Для автоматизации этого процесса была использована модель нейронной сети aksty/promptgen, основанная на gpt-neo. Применение этой модели позволяет автоматически создавать качественный запрос с использованием ключевых слов для улучшения генерации изображения. На рис. 9 представлен исходный код для применения модели по корректировке запроса.

Для оценки изменений качества изображения с использованием скорректированного запроса и без него были сгенерированы два изображения по запросу «river in the forest». Изображение без скорректированного запроса представлено на рис. 10.

der_inil_(sell):

## prompt gen unknown

self.tokenizer = GPT2Tokenizer.from_pietrained("aksty/promptgeii") self.model = GlHrNeoForCausalLMTrum jretrained("aksty/promptgen'')

tlef generatefself, prompt):

iiipuMds = seIf.tokenizer(prompt, return_tensors="pt").input_kls outputs = self, mod el.generatefinputids, dn_sampkl=Ti-ue, mav_lenfith=l(K)) return self.tokenizer.batc!i_decode(outputs, skip_spetinl_lokeus=True)

def liandle_upgr;uk_prompt(sdf):

raw data = self, pi'nmptin put.get("ft.fl", "end")

self.promplinput.delelef'O.O", "end")

beauty prompt = self.prompt_upgrader.generate(row_data)

beauty_prompt_str = heauty_pi-ompt[0]

h e a u ty _p romp t_s tr. repla ce(' \n',11)

self.prompl input.inserlC'O.O", h e a u ty _p romptstr)

Рис. 9. Исходный код для использования модели по корректировке запроса

Рис. 10. Сгенерированное нейронной сетью изображение по первоначальному (нескорректированному) запросу

На рис. 10 продемонстрирован результат сгенерированного изображения нейронной сетью, при этом видно, что на нем вода не выглядит реалистичной, деревья представлены абстрактными формами, и в целом изображение получилось размытым и нечетким.

После обработки исходного пользовательского ввода моделью нейронной сети для корректировки запроса в генеративную модель для изображений были отправлены следующие параметры: «river in the forest, extremely detailed digital painting, in the style of Fenghua Zhong and Ruan Jia and jeremy lipking and Peter Mohrbacher, mystical colors, rim light, beautiful Lighting, 8k, stunning scene, raytracing, octane, trending on artstation». В результате чего на выходе было получено следующее изображение (рис. 11).

Рис. 11. Сгенерированное нейронной сетью изображение с использованием скорректированного запроса

После корректировки запроса заметно повысилось качество изображения воды, добавлены новые детали, придающие изображению натуральности, так же деревья и трава стали выглядеть более натурально.

Таким образом, в результате проведенного исследования разработана программа, способная по небольшому описанию сгенерировать качественное изображение путем корректировки запроса с помощью модели нейронной сети. Преимуществом данной разработки в сравнении с другими сервисами и программами для генерации изображений является полная автономность и независимость от сетевого подключения после первого запуска и скачивания всех моделей, а так же уникальность взаимодействия технологии генерации скорректированного запроса с технологией генерации изображений. Основным недостатком являются высокие системные требования для работы программы, поскольку она задействует cuda ядра видеокарты для генерации изображения. Кроме того, на видеокарте «Nvidia 2080Й» генерация изображения занимает от 1 минуты до 5 минут в зависимости от размера генерируемого изображения. При этом следует отметить, что видеокарты поколения выше должны существенно сократить время генерации [15]. Таким образом, проведенный эксперимент по применению разработанного программного обеспечения продемонстрировал, что предлагаемый инструмент позволит пользователю любого уровня освоения компетенций в области формирования запросов получить качественный результат в каждом отдельном случае формирования запроса.

При дальнейшем развитии технологий искусственного интеллекта разработанный программный продукт может быть усовершенствован путем применения более развитых моделей с меньшим количеством дефектов изображения и более корректным запросом. В целом описанное программное обеспечение может быть применено в различных сферах человеческой деятельности (в т.ч. в экономике, в строительстве, в военном деле, на стыке областей хозяйственной деятельности).

Список литературы

1. Морозов А.В., Панамарев Г.Е., Гусеница Я.Н. Состояние и перспективы развития современной науки в области информационно-телекоммуникационных технологий в военном инновационном технополисе «ЭРА» // Состояние и перспективы развития современной науки по направлению «ИТ-технологии». Сборник трудов II Всероссийской научно-технической конференции. Анапа: Военный инновационный технополис «ЭРА». 2023. С. 7-18.

2. Панамарев Г.Е., Родыгина И.В., Шевченко А.А. Сравнение нейронных сетей для обнаружения медицинской маски на фото и видео // Эксплуатация морского транспорта. 2021. N 3 (100). С. 169-177.

3. Панамарев Г.Е., Шевченко А.А. Система обучения нейронной сети для распознавания морских объектов // Вестник государственного морского университета имени адмирала Ф.Ф. Ушакова. 2021. N 1 (34). С. 39-47.

4. Искусственный интеллект [Электронный ресурс] URL: https://www.kp.ru/expert/elektronika/iskusstvennyj-inteUekt/ (дата обращения: 23.07.2024).

5. Указ Президента РФ от 10 октября 2019 г. N 490 «О развитии искусственного интеллекта в Российской Федерации» (Национальная стратегия развития искусственного интеллекта на период до 2030 года) // Собрание законодательства Российской Федерации от 14 октября 2019 г. N 41. Ст. 5700.

6. Федеральный закон от 24 апреля 2020 г. N 123-Ф3 «О проведении эксперимента по установлению специального регулирования в целях создания необходимых условий для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации - городе федерального значения Москве и внесении изменений в статьи 6 и 10 Федерального закона «О персональных данных» // Собрание законодательства Российской Федерации от 27 апреля 2020 г. N 17. Ст. 2701.

7. Распоряжение Правительства РФ от 6 мая 2008 г. N 671-р. D7. Федеральный проект «Искусственный интеллект» // Собрание законодательства Российской Федерации от 19 мая 2008 г. N 20. Ст. 2383.

8. Распоряжение Правительства РФ от 19 августа 2020 г. N 2129-р. Концепция развития регулирования отношений в сфере технологий искусственного интеллекта и робототехники до 2024 года // Собрание законодательства Российской Федерации от 31 августа 2020 г. N 35. Ст. 5593.

9. Паспорт национальной программы «Цифровая экономика Российской Федерации» (утв. президиумом Совета при Президенте Российской Федерации по стратегическому развитию и национальным проектам 24 декабря 2018 г. N 16). Гарант [Электронный ресурс] URL: http://garant.ru (дата обращения: 25.07.2024).

10. Гринин Л.Е., Гринин А.Л., Гринин И.Л. Искусственный интеллект: развитие и тревоги, взгляд в будущее. Статья первая. Информационные технологии и искусственный интеллект: прошлое, настоящее и некоторые прогнозы // Философия и общество. 2023. N 3 (108) [Электронный ресурс] URL: https://cyberleninka.ru/article/n/iskusstvennyy-intellekt-razvitie-i-trevogi-vzglyad-v-buduschee-statya-pervaya-informatsionnye-tehnologii-i-iskusstvennyy-intellekt (дата обращения: 02.08.2024).

11. Гармс А.А. Между этикой и прогрессом: проблемы развития искусственного интеллекта // BECSOR. 2023. N 3 [Электронный ресурс] URL: https://cyberleninka.ru/article/n/mezhdu-etikoy-i-progressom-problemy-razvitiya-iskusstvennogo-intellekta (дата обращения: 06.08.2024).

12. Viola Z. AI is already taking video game illustrators' jobs in China // Rest of World [Электронный ресурс] URL: https://restofworld.org/2023/ai-china-video-game-layoffs-illustrators/ (дата обращения: 13.08.2024).

13. Малашук Е.В. Инструменты ИИ в веб дизайне: области применения и методы использования // Инновационная наука. 2023. N 10-1 [Электронный ресурс] URL: https://cyberleninka.ru/article/n/instrumenty-ii-v-veb-dizayne-oblasti-primeneniya-i-metody-ispolzovaniya (дата обращения: 13.08.2024).

14. Семен Б. Kandinsky Video и Kandinsky 3.0: что умеют новые нейросети / Индустрия 4.0 // РБК Тренды [Электронный ресурс] URL: https://trends.rbc.ru/trends/industry/655f336b9a79473dd5b3e40a (дата обращения: 16.08.2024).

15. Paul A., Matt S. Stable Diffusion Benchmarks: 45 Nvidia, AMD, and Intel GPUs Compared // Tom's Hardware [Электронный ресурс] URL: https://www.tomshardware.com/pc-components/gpus/stable-diffusion-benchmarks (дата обращения: 16.08.2024).

Панамарева Олеся Николаевна, канд. эконом. наук, доцент, научный сотрудник научно-исследовательского отдела, [email protected], Россия, г. Анапа, ФГАУ «Военный инновационный технополис «ЭРА».

Муравьёв Андрей Геннадьевич, старший оператор научной роты, [email protected], Россия, г. Анапа, Военный инновационный технополис «ЭРА»

Квасов Михаил Николаевич, канд. техн. наук, начальник лаборатории испытательной, [email protected], Россия, г. Анапа, ФГАУ «Военный инновационный технополис «ЭРА»

DEVELOPMENT OF A SOFTWARE PRODUCT FOR ENSURE THE INTEGRATED OPERATION OF GENERATIVE

MODELS OF NEURAL NETWORKS

O.N. Panamareva, A.G. Muravyov, M.N. Kvasov

Neural networks allow us to create new unique texts, images, music, but for a good result of their work we need a high-quality request, the preparation of which can be difficult for an ordinary. Therefore, the questions of developing a service that combines image generation and generative query improvement, and its automation, are relevant. The paper reveals the features of using generative neural networks to create images at the user's request. The essence of the developed software product is described. It is based on models of generative neural networks Kandinsky 2.2 and retraining gpt-neo. The programming language Python 3.11 and a set of libraries are used to it. An experimental study confirmed the effectiveness of this software product.

Key words: neural networks, artificial intelligence, complex operation, generative models, request.

Panamareva Olesya Nikolaevna, Candidate of economic sciences, Associate Professor, Associate Researcher, Research Department, [email protected], Russia, c. Anapa, Federal State Autonomous Institution Military «Innovativ Technopolis «ERA»

Muravyev Andrey Gennadyevich, Senior operator of the scientific company, [email protected], Russia, c. Anapa, Federal State Autonomous Institution Military «Innovativ Technopolis «ERA»

Kvasov Mihail Nikolaevich, Candidate of technical sciences, Head of Research laboratory, [email protected], Russia, c. Anapa, Federal State Autonomous Institution Military «Innovativ Technopolis «ERA»

i Надоели баннеры? Вы всегда можете отключить рекламу.