Научная статья на тему 'РАЗРАБОТКА МЕТОДОВ ОБНАРУЖЕНИЯ СУБЪЕКТИВНОСТИ ДЛЯ АНАЛИЗА НАСТРОЕНИЙ В СОЦИАЛЬНЫХ СЕТЯХ'

РАЗРАБОТКА МЕТОДОВ ОБНАРУЖЕНИЯ СУБЪЕКТИВНОСТИ ДЛЯ АНАЛИЗА НАСТРОЕНИЙ В СОЦИАЛЬНЫХ СЕТЯХ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
75
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БОЛЬШИЕ ДАННЫЕ / АНАЛИЗ СОЦИАЛЬНЫХ СЕТЕЙ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / КЛАССИФИКАЦИЯ / ФОТОГРАФИЧЕСКИЕ ИЗОБРАЖЕНИЯ

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Кенжина Л. Ж.

В данной статье представлен краткий обзор методов анализа и извлечения данных из фотографических изображений в социальных сетях с целью обнаружения субъективности и прогнозирования с помощью новых технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE DEVELOPMENT OF DETECTION METHODS SUBJECTIVITY FOR MOOD ANALYSIS IN SOCIAL MEDIAS

This article provides a brief overview of methods for analyzing and extracting data from photographic images on social networks in order to detect subjectivity and predict using new technologies.

Текст научной работы на тему «РАЗРАБОТКА МЕТОДОВ ОБНАРУЖЕНИЯ СУБЪЕКТИВНОСТИ ДЛЯ АНАЛИЗА НАСТРОЕНИЙ В СОЦИАЛЬНЫХ СЕТЯХ»

УДК 316.62

Кенжина Л.Ж.

магистрант кафедры информационной безопасности Евразийский национальный университет имени Л.Н. Гумилёва

(Казахстан, г. Нур-Султан)

РАЗРАБОТКА МЕТОДОВ ОБНАРУЖЕНИЯ СУБЪЕКТИВНОСТИ ДЛЯ АНАЛИЗА НАСТРОЕНИЙ В СОЦИАЛЬНЫХ СЕТЯХ

Аннотация: в данной статье представлен краткий обзор методов анализа и извлечения данных из фотографических изображений в социальных сетях с целью обнаружения субъективности и прогнозирования с помощью новых технологий.

Ключевые слова: большие данные, анализ социальных сетей, искусственный интеллект, классификация, фотографические изображения.

С развитием новых технологий и цифровизации, все больше набирает популярность развитие онлайн платформ для работы, бизнеса, саморазвития, развлечения (фильмы, музыка, изображения). Кроме того, такие онлайн платформы зачастую становятся площадкой для размещения информации о себе, обмена своими интересными моментами из жизни, эмоциями, взглядами на жизнь или на публикации других пользователей социальных сетей.

По данным мониторинга Ranking.kz одними из популярных социальных сетей в мире являются Facebook с долей пользователей 69,8%, Pinterest (11,9%), Twitter (9,5%), YouTube (4,9%) и Instagram (2,6%).

В Казахстане лидерами являются сеть Pinterest: 32,7%, YouTube (20,4%), «ВКонтакте» (14,9%), Facebook (13,5%) и Twitter (11,3%).

В указанных социальных сетях содержится большое количество данных из которых можно извлечь ценную информацию о пользователе и его

окружающих людях используя возможности новых технологий таких как анализ больших данных, data mining и искусственный интеллект.

В данной статье мы рассмотрим пути обнаружения субъективности на основе анализа настроений в социальных сетях.

Методы обнаружения субъективности для анализа настроений в социальных сетях

Согласно отчету о состоянии цифровой сферы Global Digital 2021 We Are Social и Hootsuite в 2021 году социальными сетями пользуются 53,6 % мирового населения. Среди самых популярных причин нахождения в социальных сетях человека являете следующее:

быть в курсе новостей и событий - 36,5 %;

просматривать развлекательный/смешной контент - 35 %;

занять свободное время - 34,4 %;

знать, чем занимаются друзья - 33 %;

делиться фотографиями и видео - 27,9 %;

искать товары с целью их купить - 27,5 %;

общаться с людьми - 26,8 %;

не отставать от друзей (потому что многие друзья есть в соцсетях) -

25,1%;

делиться своим мнением - 23,4%; знакомиться с людьми - 21,3 %; общаться по работе - 20,3 %; ничего не пропустить - 18,9 %;

смотреть и отслеживать спортивные события - 18,6 %; следить за новостями известных людей - 17,6 %; делиться информацией о своей жизни - 16,3 %;

продвигать и поддерживать благотворительные мероприятия - 12,5%.

Ежедневно через социальные сети протекает большой поток структурированных и неструктурированных данных, обработка и анализ которых позволит получить экономические, политические и социальные выгоды для бизнеса, государства и для самого человека.

Результаты анализа социальных сетей поддерживает бизнес сообщество в части проведения анализа клиентов, улучшения продукта и увеличения дохода компании. В государственном секторе способствует развитию стратегии управления их деятельности и поддержке принятия решения. Анализ социальных сетей так же используется в целях защиты национальной безопасности и применения правоохранительных мер.

Основным источником анализа социальных сетей являются текстовые данные. Но в последнее время анализ изображений, аудио-видео контента становится все более важным.

Будь это мем, фото, селфи или ссылка на статью, социальные сети все чаще наполняются большим количеством изображений и меньшим количеством текста.

В этой статье я хочу остановиться на анализе фотографического изображения (фото, селфи), обработке их с data mmig-а и прогнозировании с помощью искусственного интеллекта.

Мировые гиганты как Facebook, Google и другие разрабатывает технологии, использующие искусственный интеллект для анализа контента изображений. Они все чаще применяют аналитику к изображениям, чтобы лучше понять их влияние на бизнес.

Так, как же научить технологии на основе изображения и имеющейся текстовой информации превратить данные в формулу или набор правил, которые мы сможем в будущем использовать для предсказания событий.

Если сравнить технологии с человеком, то искусственный интеллект человека работает на протяжении всей его жизни. Имея личные данные (возраст, вес, тип кожи), человек знает, что если он не будет ухаживать за своим лицом, то

появятся морщинки, прыщи, черные точки и т.д. На основе прошлых данных и настоящих данных он обучил свои мозг, выстроил формулу или правило: темные пятна = косметологические процедуры.

Также и от изображений можно извлечь данные и классифицировать их, чтобы новые технологии искусственного интеллекта с математической точностью понимали суть фотографии.

Для анализа и извлечения данных от изображения нам необходимо воспользоваться простой классификацией ответив на простые вопросы: для кого? (с целью определения аудитории), о чем? (с целью определения областью исследования) и зачем? (с целью определения конечного результата).

Продолжая тему проблемной кожи, представим, что вы - менеджер по рекламе в головном офисе косметологической компании. И перед вами стоит задача увеличить объем продажи крема для лица и рук, маски для лица и рук, сыворотки для лица и другие предметы ухода за лицом и рук для женщин в возрасте от 25 до 60 лет.

Из данных фокус-групп вы знаете, что у женщин в данном возрасте входит в привычку покупать средства по уходу за лицом. Ваша задача максимизировать шансы стать магазином № 1 для этих людей.

Но, для этого необходимо, чтобы эти женщины увидели вашу рекламу до того, как купят свой первый крем где-то еще. И они должны узнать о вас до того, как у них появятся первые морщинки.

Из этого можно сделать вывод: вам нужна прогностическая модель, способная определить потенциальную женщину с морщинками для дальнейшего целевого маркетинга.

Основным секретным оружием для построения такой модели являются учетные записи пользователя социальной сети, где нам известен возраст, пол пользователя, место нахождения и круг общения, а также его фотографическое изображение (фото или селфи).

Самым простым способом обнаружения субъективности по отношению к размещенному изображению являются комментарии и количество «лайков».

Рассматривая комментарии, мы конечно столкнемся с «набором слов», где мы применим наивный байесовский классификатор и научим его отличать одно слово от другого.

Кроме того, проведем анализ пользователей, оставивших отметку «лайк» под фотографическим изображением.

И третьим основным шагом является анализ и извлечение данных из фотографических изображений пользователя социальной сети (настроение, пол, возраст, место расположения и т.д.) с помощью новых технологии и сравним с данными учетной записи.

Анализируя изображения можно одновременно распознавать несколько элементов на фотографии, включая логотипы, лица, действия, объекты, сцены и автоматически выводить основную информацию о том, что «женщина стоит под солнцем с велосипедом и горами на заднем плане».

Технология, лежащая в основе анализа изображений, быстро развивается, что значительно упрощает масштабирование. Изображения показывают контекстные, средовые и эмоциональные факторы, которые невозможно получить с помощью простого текста.

Однако, анализ изображений это не только их распознавание и сбор данных, но и объединение с другими источниками данных с разработкой модели для прогнозирования возникающих тенденций в социальных сетях и реагирования на них.

СПИСОК ЛИТЕРАТУРЫ:

Андреас Польссон, Дэниел Серзен, Классификация настроений в социальных сетях Анализ методов и влияние удаления смайлов, стр. 5-9, ссылка на ресурс: http://www.diva-portal.org/smash/get/diva2:930520/FULLTEXT01 .pdf Сачира Чинтана Джаясанка, Саминда Премаратне, Тилина Мадхушани, Анализ настроений для социальных сетей, ссылка на интернет-ресурс: https://www.researchgate.net/publication/268817500 Sentiment Analysis for Socia l Media

Александра Балахур, Марко Турчи, Сравнительные эксперименты с использованием контролируемого обучения и машинного перевода для анализа мнений на разных языках, стр. 3-5, 8, ссылка на интернет-ресурс: https://www.sciencedirect.com/science/article/abs/pii/S0167923612001339 А. А. Браницкий, Е. В. Дойникова, Использование нейросетей для прогнозирования подверженности пользователей социальных сетей деструктивным воздействиям, ссылка на ресурс

Ассоциация компьютерной лингвистики, Девятый семинар по вычислительным подходам к Субъективность, настроения и анализ социальных сетей, 2018, ссылка на интернет-ресурс: https://www.aclweb.org/anthology/volumes/W18-62/ Г.Хадди, Академия технологии, 2019, ссылка на интернет-ресурс: https : //www.brandwatch. com/blog/image-analysis/

Ю.Сергеева, 2021, ссылка на интернет-ресурс: https : //www.web-

canape.ru/business/vsya-statistika-interneta-i-socsetej-na-2021-god-cifry-i-trendy-v-

mire-i-v-rossii/

Kenzhina L.Z.

Master's student of the Department of Information Security Eurasian National University (Kazakhstan, Nur-Sultan)

THE DEVELOPMENT OF DETECTION METHODS SUBJECTIVITY FOR MOOD ANALYSIS IN SOCIAL MEDIAS

Abstract: this article provides a brief overview of methods for analyzing and extracting data from photographic images on social networks in order to detect subjectivity and predict using new technologies.

Keywords: big data, social media, artificial intelligence, classification, photographic

images.

i Надоели баннеры? Вы всегда можете отключить рекламу.