Научная статья на тему 'Сравнительный анализ семантического поля "обман" на материале русского и английского языков'

Сравнительный анализ семантического поля "обман" на материале русского и английского языков Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
418
70
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
WORD2VEC / ОБМАН / ЛОЖЬ / НЕЙРОННЫЕ СЕТИ / РАСПОЗНАВАНИЕ ЛЖИ / МАШИННОЕ ОБУЧЕНИЕ / ВЕКТОРЫ СЛОВ / ИЗВЛЕЧЕНИЕ ДАННЫХ / DECEPTION / LIE / NEURAL NETWORKS / LIE DETECTION / MACHINE LEARNING / WORD EMBEDDINGS / DATA MINING

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лыкова О. В., Гордеев Д. И.

Данная статья посвящена анализу семантического поля «обман» в английском и русском языках на материале анонимных форумов Интернета. Для проведения эксперимента была собрана база данных сообщений анонимных форумов и использовался алгоритм word2vec, позволивший проанализировать 30 млн словоупотреблений для каждого из языков. Метод word2vec был выбран для анализа, так как на данный момент он является одним из наиболее эффективных способов представления лексического пространства в векторном виде. Данный анализ выявил 10 слов с наибольшей семантической близостью для терминов из семантических полей «обман» и «deception» соответственно, что позволило сравнить данные феномены для разных языков. Семантическая близость между словами была вычислена с помощью косинусного расстояния между терминами, характеризующими семантические поля «обман» и «deception», и другими понятиями, входящими в корпус. Полученные результаты продемонстрировали склонность носителей русского языка ассоциировать понятие обмана с религиозной и духовной сферой, в то время как для пользователей американского форума характерно соотносить термин «deception» с политикой и смежными понятиями. Предложенный метод исследования может в дальнейшем быть использован для проведения межкультурного сравнительного анализа данных концептов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARATIVE ANALYSIS OF THE SEMANTIC FIELD “DECEPTION”. A CASE STUDY OF RUSSIAN AND AMERICAN IMAGEBOARD MESSAGES

This article uses the material of anonymous Internet forums to analyse the semantic field of deception. Two major imageboards were investigated: 2ch. hk and 4chan.org being the most popular Russian and American imageboards. For the experiment a database of messages from these forums was collected and an algorithm called word2vec was used to examine 30 million word usages for each of the languages. The word2vec method was chosen for the analysis, because at the moment it is one of the most effective ways of representing lexical space in a vector form. This analysis revealed 10 words with the highest semantic proximity for terms from the semantic field of “deception” for Russian and American English languages respectively, which allowed to compare this phenomenon in the analysed languages. The semantic proximity between words was calculated using the cosine distance between terms that characterize the semantic field under analysis and concepts that are present in the corpus. Results showed the tendency among native Russian imageboard users to link the concept of deception with religion and spiritual sphere, while American forum users tend to associate the notion of deception with politics and other similar concepts. The proposed research method can later be used to conduct cross-cultural comparative analysis of these concepts. The findings suggest new challenges for future research, since the study of lies and deception is a relatively new research field for Russian science.

Текст научной работы на тему «Сравнительный анализ семантического поля "обман" на материале русского и английского языков»

УДК 81'322.2

О. В. Лыкова, Д. И. Гордеев

О.В.Лыкова, преподаватель в НИЯУ МИФИ, аспирант кафедры прикладной и экспериментальной лингвистики МГЛУ; e-maiL: OVLykova@mephi.ru Д.И.Гордеев, преподаватель в НИЯУ МИФИ, аспирант кафедры прикладной и экспериментальной лингвистики МГЛУ, e-maiL: gordeev-d-i@yandex.ru

СРАВНИТЕЛЬНЫЙ АНАЛИЗ СЕМАНТИЧЕСКОГО ПОЛЯ «ОБМАН» НА МАТЕРИАЛЕ РУССКОГО И АНГЛИЙСКОГО ЯЗЫКОВ

Данная статья посвящена анализу семантического поля «обман» в английском и русском языках на материале анонимных форумов Интернета. Для проведения эксперимента была собрана база данных сообщений анонимных форумов и использовался алгоритм word2vec, позволивший проанализировать 30 млн словоупотреблений для каждого из языков. Метод word2vec был выбран для анализа, так как на данный момент он является одним из наиболее эффективных способов представления лексического пространства в векторном виде. Данный анализ выявил 10 слов с наибольшей семантической близостью для терминов из семантических полей «обман» и «deception» соответственно, что позволило сравнить данные феномены для разных языков. Семантическая близость между словами была вычислена с помощью косинусного расстояния между терминами, характеризующими семантические поля «обман» и «deception», и другими понятиями, входящими в корпус. Полученные результаты продемонстрировали склонность носителей русского языка ассоциировать понятие обмана с религиозной и духовной сферой, в то время как для пользователей американского форума характерно соотносить термин «deception» с политикой и смежными понятиями. Предложенный метод исследования может в дальнейшем быть использован для проведения межкультурного сравнительного анализа данных концептов.

Ключевые слова: word2vec; обман; ложь; нейронные сети; распознавание лжи; машинное обучение; векторы слов; извлечение данных.

O. V. Lykova

Teacher at NationaL Research NucLear University MEPHI, postgraduate student at the Department of AppLied and ExperimentaL Linguistics, Moscow State Linguistic University, OVLykova@mephi.ru

D. I. Gordeev

Teacher at NationaL Research NucLear University MEPHI, postgraduate student at the Department of AppLied and ExperimentaL Linguistics, Moscow State Linguistic University, gordeev-d-i@yandex.ru

COMPARATIVE ANALYSIS OF THE SEMANTIC FIELD "DECEPTION". A CASE STUDY OF RUSSIAN AND AMERICAN IMAGEBOARD MESSAGES

This articLe uses the material, of anonymous Internet forums to anaLyse the semantic field of deception. Two major imageboards were investigated: 2ch. hk and 4chan.org being the most popuLar Russian and American imageboards. For the experiment a database of messages from these forums was coLLected and an aLgorithm caLLed word2vec was used to examine 30 miLLion word usages for each of the Languages. The word2vec method was chosen for the anaLysis, because at the moment it is one of the most effective ways of representing LexicaL space in a vector form. This anaLysis reveaLed 10 words with the highest semantic proximity for terms from the semantic fieLd of "deception" for Russian and American EngLish Languages respectiveLy, which aLLowed to compare this phenomenon in the anaLysed Languages. The semantic proximity between words was caLcuLated using the cosine distance between terms that characterize the semantic fieLd under anaLysis and concepts that are present in the corpus. ResuLts showed the tendency among native Russian imageboard users to Link the concept of deception with reLigion and spirituaL sphere, whiLe American forum users tend to associate the notion of deception with poLitics and other simiLar concepts. The proposed research method can Later be used to conduct cross-cuLturaL comparative anaLysis of these concepts. The findings suggest new chaLLenges for future research, since the study of Lies and deception is a reLativeLy new research fieLd for Russian science.

Key words: word2vec; deception; Lie; neuraL networks; Lie detection; machine Learning; word embeddings; data mining.

В последнее время исследование лжи и обмана приобретает всё большее значение. Известно, что данный феномен чрезвычайно важен для современной прикладной лингвистики, психологии и психолингвистики, полиграфологии и даже юриспруденции. Повышенное внимание к данному явлению обусловлено тем фактом, что люди пытались обнаружить обман годами и даже веками, но в наши дни из-за таких передовых технологий, как полиграф и искусственные нейронные сети, задача выявления реализации ложных высказываний становится более решаемой и приносит более достоверные результаты.

Речь - это способ общения с обратной связью, человек слышит то, что он говорит, поэтому контролирует речь. Легче обмануть, скрыть или исказить правду с помощью слов. В ложном высказывании фактическое состояние вещей преднамеренно описывается в искаженном виде, чтобы ввести в заблуждение партнера по коммуникации. Обман приводит к изменениям в сознании, он построен по другому принципу и «имеет свои собственные правила, свои методы» [Luria 1927, с. 92],

которые можно выявить в процессе лингвистического анализа высказываний. Таким образом, ложное утверждение представляет собой информацию, преднамеренно передаваемую в искаженной форме, сопровождающую изменение мышления и приводящее к изменению невербального поведения. Часть информации выражается явно, т. е. с помощью лингвистических средств, специально предназначенных для ее прямого выражения, другая часть передается с помощью невербальных средств коммуникации.

Ложное утверждение представляет собой сложное лингвистическое, психологическое и паралингвистическое явление. Паралингви-стические параметры высказывания - это характеристики, которые сопровождают речь, такие как голос, артикуляция, выражение лица, жесты, движения тела и т. д. [Потапова 2006]. Таким образом, при анализе высказывания следует рассматривать все параметры, сопровождающие речь коммуниканта, для получения более точных результатов.

Дефиниция терминов «ложь», «обман» и «неправда» иногда может быть неточной и противоречивой из-за сложного и двусмысленного характера данных понятий. Кроме того, семантические поля этих слов являются разными для разных языков и культур. Следовательно, изучение определений этих терминов, предложенных многочисленными исследователями, может способствовать пониманию данных концептов и продвижению исследования верификации лжи. Кроме того, точное определение этих слов и понимание их семантических полей позволит нам избежать ошибок при их интерпретации и переводе.

Существует множество определений данных понятий, предложенных известными исследователями из разных стран.

Американский ученый Пол Экман является одним из ведущих экспертов, изучающих ложь и обман, и, возможно, самым известным. По его словам, ложь возникает, когда один человек специально вводит в заблуждение другого, делая это преднамеренно, без предварительного уведомления о своей цели, и без явно выраженной просьбы вести себя подобным образом от партнера по коммуникации [Экман 2009]. Согласно вышеприведенному определению, ложь должна соответствовать как минимум пяти необходимым условиям. Во-первых, для этого нужен лгущий коммуникант. Во-вторых, требуется реципиент, на которого лгущий коммуникант направляет свой обман. В-третьих, высказывание должно быть обманчивым. Кроме того, лгущий

коммуникант должен иметь намерение обмануть реципиента. Более того, лгущий коммуникант намерен ввести в заблуждение своего партнера по коммуникации «без предварительного уведомления о своей цели», т. е. лишить его законного права (осознаваемого лгущим коммуникантом) получить полную информацию, его «права на правду». Из данного определения следует, что ложь может рассматриваться как отказ в праве на получение информации, т. е. незаконное действие [Потапова 2016].

П. Экман выделяет две основные формы лжи: сокрытие истины и ее искажение (предоставление собеседнику ложной информации). «Если лжец скрывает информацию, он не сообщает ложную информацию. В случае искажения информации лжец предпринимает некоторые дополнительные действия - он не только скрывает правду, но также предоставляет ложную информацию, притворяясь, что она является правдой» [Ekman 2012]. Если рассматривать определение обоих видов лжи относительно нарушения закона, становится ясно, что, согласно определению П. Экмана, сокрытие истины, т. е. молчание, также можно рассматривать как незаконное действие.

Существуют и другие определения понятия «ложь», которые подтверждают, что семантическое поле данного термина связано с идеей нарушения прав человека. Ложь можно считать «преднамеренной успешной или неуспешной попыткой, без предупреждения, создать в сознании собеседника убеждение, которое лгущий коммуникант считает неверным» [Vrij 2000]. Д. Смит описывает ложь как «любую форму поведения, целью которой является предоставление собеседникам ложной информации или лишение их истинной информации» [Smith 2004]. Оба ученых подчеркивают незаконную природу лжи, полагая, что законным действием в данном случае было бы предостеречь собеседников («без предупреждения») и, таким образом, не лишать их законного права на получение информации («лишить их истинной информации»).

Значительный вклад в изучение понятий «ложь» и «обман» внес известный российский ученый В. Знаков. Его исследования были посвящены социальной, психологической и моральной природе лжи. Проведенный им эксперимент с участием 317 русских и 49 вьетнамских людей, изучение исторических источников, а также русских и зарубежных словарей способствовало изучению межкультурных различий между данными понятиями. Полученные результаты позволили ему предположить, что хотя существует много определений

термина «ложь», важно не путать этот термин с таким понятием, как «неправда» [Знаков 1999]. В. Знаков выделяет 3 разновидности понятия «неправда»: 1) вербальный эквивалент ошибки; 2) различные формы аллегории (аллегория, ирония), т. е. слова, которые в определенном контексте приобретают значение, противоположное их буквальному значению; 3) форма лжи. При этом он считает ложь не информативным, а коммуникативным явлением. Ложь - это не столько средство преднамеренного искажения фактов, сколько способ установления контакта и объединения людей. Ложь не предназначена для того, чтобы в нее верили, ее не используют, чтобы ввести в заблуждение слушателя и, таким образом, получить какую-то личную выгоду. В. Знаков полагает, что именно обман является наиболее уместным определением для ситуации, которая основана на сознательном желании одного из собеседников создать в сознании других коммуникантов ложную идею о предмете обсуждения, но, как замечает В. Знаков, в то же время автор обманчивого сообщения не искажает факты. При этом В. Знаков выделяет два основных типа обмана - обман с помощью полуправды и обман с помощью произнесения правды. Автор также считает, что хотя основная часть определений лжи, сформулированных западными мыслителями, основана на идеях нарушения прав человека, те, что даются российскими учеными и философами, подчеркивают аморальный характер лжи.

Известный русский философ В. С. Соловьев полагает, что в отличие от заблуждения и ошибки, ложь означает «сознательную и морально предосудительную противоположность истине» [Соловьев 1996]. Понимание лжи в русской культурной традиции имеет существенную особенность: в определении этого явления часто содержатся указания на морально предосудительный характер поведения лгущего субъекта. Например: «Он лжет не краснея» [Ожегов 1992]. Таким образом, можно видеть, что российские ученые склонны описывать ложь как бесчестное действие, которое является морально предосудительным. Определение лжи в русской культуре можно рассматривать с точки зрения морали, в отличие от традиций западных культур, где определение лжи рассматривается с точки зрения ее законности.

Однако со временем моральные представления могут изменяться. Всеобщая анонимность и Интернет «размывают» моральные устои [Акулич 2012]. Кроме того, само понятие лжи может изменяться в условиях анонимности в современном обществе. Тем самым на данный

момент является крайне актуальной проверка вышеприведенных соображений о сущности лжи для молодых пользователей Интернета в условиях анонимности. Одним из примеров активных сообществ с практически полной анонимностью являются имиджборды.

Сообщения пользователей имиджбордов были проанализированы с помощью алгоритма 1^М2уес, результат выдачи которого может служить аналогом ассоциативного эксперимента [Уш^еш 2012].

В данном исследовании было рассмотрено два имиджборда: 2ch.hk и 4chan.org, которые являются самыми популярными русскоязычным и англоязычным имиджбордами соответственно (см. рис. 1). Была использована CBOW (continuous bag of words) версия word2vec, так как она предпочтительнее для анализа коротких сообщений и дает более точные результаты для сравнения близости между словами (MSR Word Relatedness Test Set) [Mikolov 2013].

Алгоритм CBOW Word2vec основан на неглубокой нейронной сети, где {x1,... xC}- это унитарные векторы слов (длина вектора соответствует длине словаря V, все значения, кроме соответствующего данному слову, нулевые, значение для данного слова равно 1), количество

C*V- dim

Рис 1. Иллюстрация алгоритма CBOW Word2vec

векторов на входе равно C - длине окна анализа. Скрытый слой - h, выход - унитарный вектор для предсказанного слова у.. Задача Сети -предсказать на основе слов из окна анализа пропущенное слово. В результате обучения нейронной сети с помощью метода стохастического градиентного спуска на основе обратного распространения ошибок получается обученный скрытый слой h для каждого из слов модели.

В результате эксперимента полученные векторы h сравнивались для слов из семантического поля «Ложь» [Бочарова 2012]. Кроме того, было проведено сравнение полученных результатов с предо-бученными векторами для Национального корпуса русского языка [Кутузов 2017].

Таблица 1

Сравнение результатов анонимных форумов и НКРЯ для русского языка и Google News для английского (близость рассчитывалась как косинусное расстояние между векторами искомого и схожего слова)

Исходное Слова корпуса ано- Бли- Слова НКРЯ Бли-

слово нимных форумов зость зость

Ложь 1. религия 0.76 1. лицемерие 0.73

2. домыслы 0.75 2. неправда 0.71

3. вера 0.73 3. полуправда 0.70

4.истина 4. клевета

5. мораль 0.72 5. обман 0.68

6. иллюзия 0.72 6. ложь 0.68

7. глупость 0.71 7. вранье 0.67

8. реальность 0.69 0.69 8. врание 0.67 0.63

9. страдание 9. фальшь

10.вранье 10. лживый

0.69 0.68 0.63 0.63

Обман 1. неравенство 0.64 1. обманута 0.74

2. ветви 0.64 2. обман 0.68

3. величайшие 0.63 3. ложь 0.68

4. созданное 0.63 4. обманом 0.64

5. вымысел 0.62 5. обманывать 0.62

6.естественного 0.61 6. надувательство 0.62

7. величина 0.61 7. самообман 0.60

8. историческое 0.61 8. самообмана 0.60

9. безобразие 0.61 9. притворство 0.59

10. превозмогание 0.61 10. бездельничество 0.59

Исходное Слова корпуса ано- Бли- Слова НКРЯ Бли-

слово нимных форумов зость зость

Клевета 1. несовершеннолетне- 0.85 1. клевет 0.72

го 0.83 2. ложь 0.68

2. совершение 0.82 3. инсинуация 0.66

3. административного 0.81 4. клевета 0.66

4.соединенная 0.81 5. клеветнический 0.66

5. подписание 0.8 6. диффамация 0.65

6. правонарушения 0.8 7. клеветник 0.64

7. заинтересованно- 0.8 8. злословие 0.62

стью 0.79 9. измышление 0.62

8. совершившим 0.79 10. навет 0.61

9. предусмотренных

10. юридического

Лесть 1. сигнализирует 0.7 1. лесть 0.67

2. притворство 0.7 2. ласкательство 0.66

3. самоиронии 0.68 3. льстивый 0.66

4. хоккинга 0.68 4. лесть 0.61

5. фантастическая 0.68 5. предан 0.61

6. суетливый 0.68 6. лицемерство 0.60

7. инферно 0.68 7. злоречие 0.60

8. рецензия 0.68 8. двуличность 0.59

9. нейрофизиология 0.68 9. угодливость 0.59

10. крымская 0.67 10.раболепство 0.58

Лице- 1. феминизм 0.73 1. ханжество 0.73

мерие 2. предательство 0.69 2. ложь 0.73

3. ложь 0.67 3. двоедушие 0.70

4. атеизм 0.66 4. фарисейство 0.67

5. общество 0.66 5. лицемерия 0.66

6.справедливость 0.65 6. притворство 0.64

7. религия 0.65 7. двуличность 0.64

8. непонимание 0.65 8. двуличие 0.64

9. проявление 0.64 9. бесчестность 0.64

10. злоба 0.64 10. лживость 0.63

Коварство 1. подлых 0.77 1. коварствый 0.68

2. у***нских 0.73 2. хитрость 0.63

3. двачерских 0.72 3. пронырство 0.63

4. илитариев 0.72 4. вероломство 0.62

5. копрофилов 0.72 5. лукавство 0.61

Исходное Слова корпуса ано- Бли- Слова НКРЯ Бли-

слово нимных форумов зость зость

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. шаблонных 0.72 6. ревнивость 0.61

7. рогов 0.72 7. коварный 0.61

8.непорочное 0.71 8. двуличие 0.60

9. донцова 0.71 9. безрассудность 0.60

10.слайсиков 0.71 10. лицемерия 0.60

Измена 1. френдзона 0.71 1. предательство 0.73

2. дружба 0.69 2. измена 0.64

3. влюбленность 0.66 3. прелюбодеяние 0.64

4. тульпа 0.64 4. неверность 0.62

5. верная 0.64 5. измен 0.61

6.честная 0.63 6. вероломство 0.60

7. имеющая 0.62 7. измене 0.60

8. случайность 0.62 8. изменник 0.59

9. сексуальная 0.62 9. измены 0.59

10. любовь 0.62 10. клятвопреступление 0.59

Мошен- 1. хулиганство 0.74 1. вымогательство 0.69

ничество 2. кражу 0.71 2. мошенничества 0.67

3. вымогательство 0.71 3. хищение 0.67

4. грабеж 0.7 4. подлог 0.63

5. умышленное 0.69 5. кража 0.63

6. уголовку 0.68 6. вымогательства 0.62

7. превышение 0.68 7. мошеннический 0.62

8. правонарушение 0.68 8. воровство 0.61

9. вознаграждение 0.67 9. шулерство 0.60

10.оптовая 0.66 10. подлога 0.60

Deception 1. rebuilds 0.91 1. deceit 0.79

2. hinduism 0.91 2. deceptions 0.7

3. list_goes_on 0.91 3. subterfuge 0.67

4. dubious 0.9 4. dishonesty 0.65

5. social_constructs 0.9 5. duplicity 0.61

6. toppled 0.9 6. deceitful 0.61

7. propensity 0.9 7. concealment 0.58

8. violenceits 0.9 8. falsehood 0.57

9. butmuh 0.9 9. misrepresentation 0.57

10. grounding 0.9 10. mendacity 0.56

Исходное Слова корпуса ано- Бли- Слова НКРЯ Бли-

слово нимных форумов зость зость

Lies 1. global warming 0.78 1. lie 0.69

2. facts 0.78 2. rests 0.57

3. ignorance 0.78 3. lurks 0.51

4. media 0.78 4. Lying 0.49

5. climate_change 0.78 5. sits 0.47

6. mainstream_media 0.77 6. exists 0.46

7. stupidity 0.77 7. lying 0.46

8. false 0.77 8. falsehood 0.45

9. free_speech 0.76 9. is 0.44

10. conspiracy 0.76 10. resides 0.44

Slander 1. left-wing 0.9 1. slanderous 0.69

2. political_correctness 0.9 2. slandering 0.68

3. purges 0.89 3. slanders 0.62

4. identity_politics 0.89 4. libel 0.6

5. medias 0.89 5. defamation 0.59

6. racially 0.88 6. defaming 0.59

7. incompetence 0.88 7. defamatory 0.59

8. nazism 0.88 8. libels 0.59

9. pro_gun 0.88 9. smear 0.58

10. suppression 0.88 10. calumnious 0.58

Flattery 1. fat_acceptance 0.87 1. cajolery 0.49

2. illusions 0.87 2. politeness 0.48

3. amino_acid 0.86 3. ingratiation 0.47

4. hypnotic 0.86 4. blandishments 0.46

5. self-awareness 0.86 5. hyperbole 0.46

6. prompting 0.86 6.sycophancy 0.45

7. psychological_warfare 0.86 7. sarcasm 0.45

8. holocaust_never_ 8. flatterer 0.45

happened 0.86 9. condescension 0.45

9. sacrificial 0.86 10. bullsh**ter 0.45

10. puerto_rican 0.86

Hypocrisy 1. lefties 0.86 1. duplicity 0.7

2. bigots 0.86 2. disingenuousness 0.69

3. liberalism 0.85 3. arrogance 0.67

4. rhetoric 0.85 4. hypocracy 0.67

5. progressives 0.84 5. shamelessness 0.65

6. idiocy 0.84 6. stupidity 0.64

7. leftists 0.84 7. absurdity 0.64

8. hillary_supporters 0.84 8. hypocritical 0.63

9. hypocrites 0.83 9. cowardice 0.62

10. crybabies 0.83 10. insincerity 0.62

Исходное Слова корпуса ано- Бли- Слова НКРЯ Бли-

слово нимных форумов зость зость

Cunning 1. fat_acceptance 0.91 1. devious 0.74

2. subculture 0.91 2. wily 0.71

3. psyop 0.91 3. canny 0.64

4. curries 0.9 4. Machiavellian 0.64

5. girl_queen 0.9 0.9 5. crafty 0.63 0.63

6. russells 6. shrewd

7. coldland 0.9 0.9 0.9 0.9 0.9 7. ruthless 0.62 0.62 0.61 0.61 0.61

8. toppled 8. wiles

9. indigenous_people 9. outwit

10. ban_swords 10. clever

Adultery 1. cognizant 0.89 1. infidelity 0.67

2. animalistic 0.89 2. Adultery 0.63

3. idealization 0.89 3. adulterous 0.62

4. disputes 0.89 4. apostasy 0.61

5. engages 0.89 5. adultry 0.6

6. infidelity 0.89 6. fornication 0.58

7. unequal 0.89 7. unfaithful 0.57

8. free_reign 0.88 8. zina 0.56

9. assaults 0.88 9. adulterers 0.56

10. equated 0.88 10. unchastity 0.56

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Fraud 1. voter_fraud 0.87 1. frauds 0.77

2. presidential 0.86 2. fraudulent 0.71

3. legislation 0.86 3. Fraud 0.7

4. supreme_court 0.86 4. scam 0.63

5. senate 0.86 5. scams 0.6

6. executive 0.85 6. embezzlement 0.59

7. violation 0.85 7. forgery 0.58

8. federal 0.85 8. swindle 0.56

9. electoral 0.85 9. bribery 0.55

10. federal_government 0.85 10. theft 0.55

Из приведенной таблицы можно заключить, что современные русскоязычные пользователи Интернета часто ассоциируют ложь с такими явлениями, как религия и феминизм. Кроме того, обобщенное представление показывает, что обман в первую очередь ассоциируется в сознании русскоговорящих пользователей форума с социальной несправедливостью и моральной стороной данного феномена («мораль», «страдание»). Американские пользователи фокусируются

больше на политической стороне семантического поля «Агрессия» («political_correctness», «nazism», «lefties», «mainstream_media»). Анализ полученных данных показал, что русскоязычные пользователи больше обращают внимание на морально предосудительный характер лжи, в то время как американские пользователи форума ассоциируют ложь и близкие к ней понятия со сферами политики и СМИ.

Заключение

Ввиду большого количества определений терминов «ложь», «обман» и «неправда», предложенных многочисленными учеными из разных стран, и выявленной разницы при анализе семантических полей данных понятий, представляется разумным полагать, что русские и западноевропейские ученые склонны интерпретировать этот термин по-разному. При анализе полученных данных были сделаны некоторые существенные выводы, касающиеся характера восприятия данных терминов в американской и русской культурах. В то время как американские пользователи анонимных форумов ассоциируют «обман» и «ложь» с политикой и правом, русскоязычные пользователи больше обращают внимание на моральный аспект данных явлений.

Полученные результаты показывают, что семантические поля данных понятий изменяются в зависимости от анализируемого языка и культуры. Чтобы избежать ошибок при использовании и переводе этих терминов, важно рассмотреть их правильное определение, их семантические поля, наиболее частый контекст их употребления и некоторые межкультурные особенности их использования и понимания.

Статистический анализ с использованием алгоритма Word2vec позволил выявить наиболее частотные термины, ассоциирующиеся с восприятием лжи для российских и американских партнеров по коммуникации, которые могут быть использованы для контент-анализа в дальнейших исследованиях.

Предложенный комплексный метод и процедура исследования в дальнейшем может быть использована для анализа семантических полей понятий «ложь», «обман» и «неправда» в различных культурах, на разных языках и для проведения межкультурного сравнительного анализа данных концептов, что способствует лучшему пониманию этих терминов и снижает вероятность ошибок при их интерпретации и переводе. Полученные данные предлагают новые задачи для

будущих исследований, поскольку изучение лжи и обмана является

относительно новой и недостаточно изученной областью исследований для российской науки.

СПИСОК ЛИТЕРАТУРЫ

Акулич М. М. Интернет-троллинг: понятие, содержание и формы // Вестник Тюменского гос. ун-та. Социально-экономические и правовые исследования. 2012. Вып. 8. С. 47-52.

Бочарова М. А. Семантическое поле как способ системного описания лексики // Вестник Российского университета дружбы народов. Серия «Вопросы образования: языки и специальность». 2012. Вып. 4. С. 63-66.

Знаков В. В. Макиавеллизм и феномен вранья // Вопросы психологии. 1999. № 6. С. 59-69.

Лурия А. Р. Речь и интеллект в развитии ребенка. М. : Госиздат, 1927. 259 с.

Ожегов С. И., Шведова Н. Ю. Толковый словарь русского языка. М. : Азъ, 1992, 88. 257 с.

Потапова Р. К., Потапов В. В. Язык, речь, личность. М. : Языки славянской культуры, 2006. 329 с.

Потапова Р. К., Лыкова О. В. Вербальное представление лжи в русской и англо-американской культурах // Коммуникация в мультикультурном обществе: материалы I Междунар. конф. М. : МИФИ, 2016. С. 58-61.

Соловьев B. С. Оправдание добра. М. : Республика, 1996. 479 с.

Экман П. Психология лжи. СПб. : Питер, 2012. С. 31-126.

Jurgens D. A., Turney P. D., Mohammad S. M., Holyoak K. J. Semeval-2012: task 2: Measuring degrees of relational similarity // Proceedings of the First Joint Conference on Lexical and Computational Semantics. Vol. 1: Proceedings of the main conference and the shared task; Vol. 2: Proceedings of the Sixth International Workshop on Semantic Evaluation, Association for Computational Linguistics, 2012. P. 356-364.

Kutuzov A., Kuzmenko E. Web Vectors: A Toolkit for Building Web Interfaces for Vector Semantic Models. In: Ignatov D. et al. (eds) Analysis of Images, Social Networks and Texts. AIST 2016. Communications in Computer and Information Science. Vol 661. Springer, Cham, 2017. P. 155-161.

Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781, 2013.

Ekman P. Telling Lies: Clues to Deceit in the Marketplace, Politics, and Marriage (Revised Edition). WW Norton & Company, 2009. 368 p.

Vrij A. Detecting Lies and Deceit. Chichester: Wiley, 2000. 276 p.

Smith D. L. Why We Lie: The Evolutionary Roots of Deception and the Unconscious Mind. New York : St. Martin's Press, 2004. 256 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.