Научная статья на тему 'ОПЫТ ПОЛЬЗОВАТЕЛЯ ТЕЛЕФОННОЙ СПРАВОЧНОЙ СЛУЖБЫ: ВЗАИМОДЕЙСТВИЕ С ОПЕРАТОРОМ-ЧЕЛОВЕКОМ И РОБОТОМ'

ОПЫТ ПОЛЬЗОВАТЕЛЯ ТЕЛЕФОННОЙ СПРАВОЧНОЙ СЛУЖБЫ: ВЗАИМОДЕЙСТВИЕ С ОПЕРАТОРОМ-ЧЕЛОВЕКОМ И РОБОТОМ Текст научной статьи по специальности «Психологические науки»

CC BY
238
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЧЕЛОВЕКО-МАШИННОЕ ВЗАИМОДЕЙСТВИЕ / КОНВЕРСАЦИОННЫЙ АНАЛИЗ / ПОЛЬЗОВАТЕЛЬСКИЙ ОПЫТ / СОЦИОТЕХНИЧЕСКИЕ БАРЬЕРЫ / МИКРОСОЦИОЛОГИЯ / HUMAN-MACHINE INTERACTION / CONVERSATION ANALYSIS / USER EXPERIENCE / SOCIO-TECHNICAL BARRIERS / MICROSOCIOLOGY

Аннотация научной статьи по психологическим наукам, автор научной работы — Максимова Алиса Сергеевна

Для социальных исследований технологий одна из актуальных тем - что происходит, когда деятельность, в прошлом осуществлявшаяся людьми и с помощью доцифровых артефактов, начинает обеспечиваться информационными технологиями. Статья рассматривает опыт пользователя телефонной справочной службы и фокусируется на вопросе о том, как организована интеракционная работа в телефонном разговоре пользователя с автоматизированным оператором и оператором-человеком. Для этого применяется рамка конверсационного анализа, позволяющая в деталях рассмотреть социальное взаимодействие. Материалом для анализа стали записи телефонных звонков в справочную службу, а также данные наблюдения и бесед с сотрудниками организации. На основе обзора существующих исследований взаимодействия людей с информационными системами выделены их основные находки и идеи. Охарактеризовано взаимодействие операторов-людей и пользователей телефонной службы: операторы следуют сценарию звонка, но за счет таких коммуникативных ресурсов, как интонация, место произнесения реплики, подтверждение слов, пользователи и операторы могут достигать взаимного понимания в разговоре. С помощью таких приемов люди справляются с ограничениями и решают проблемы во взаимодействии. Далее проанализировано взаимодействие пользователей и робота. Посредством сравнения этих телефонных звонков с разговорами с обычными операторами выявлены особенности интеракционной работы участников взаимодействия в случае, когда пользователи сталкиваются с машиной. Показано, что робот действует независимо и не реагирует на ситуативные обстоятельства, делает реплики пользователей дискретными и контролирует, что и в каком месте разговора может быть сказано и считано. Тем не менее пользователи адаптируются к этим интеракционным особенностям в процессе звонка

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INFORMATION SERVICE USER EXPERIENCE: INTERACTION WITH HUMAN AND ROBOT OPERATOR

In social studies of technology, one of the topical issues concerns what happens when tasks and activities performed by people before are provided by information technologies. This article examines the experience of a telephone inquiry service user and focuses on the question of how interaction work is organized in a telephone conversation of a user with an automated operator and human operator. To answer this question, as framework of conversation analysis is employed, which allows considering social interaction in detail. Records of telephone calls to the reference service, as well as data from observation and conversations with employees of the organization, were material for the study. It is shown that in studies of social interaction with information systems scholars point out the limitations of the machine’s communicative resources. Examination of call center case (interaction of human operators and users) proves that operators are capable of following a call “script”, cope with organizational restrictions and solve problems in interaction using turn-taking, tone, and even speech overlaps to achieve mutual understanding with users. Then, the interaction of users and robots is analyzed and compared with human operators. We identify the features of the interaction work of conversation participants in cases where users encounter a machine. It is shown that the robot acts independently from its counterpart and does not respond to situational circumstances, it “detaches” user’s turns and makes them separate, controls what can be said and perceived - and at which points. However, users adapt to these specific interaction features during a call

Текст научной работы на тему «ОПЫТ ПОЛЬЗОВАТЕЛЯ ТЕЛЕФОННОЙ СПРАВОЧНОЙ СЛУЖБЫ: ВЗАИМОДЕЙСТВИЕ С ОПЕРАТОРОМ-ЧЕЛОВЕКОМ И РОБОТОМ»

опыт пользователя телефонной

СПРАВОЧНОЙ СЛУЖБЫ: ВзАИМОДЕЙСТВИЕ

с оператором-человеком и роботом

Алиса Сергеевна Максимова ([email protected])

Социологический институт РАН — филиал Федерального научно-исследовательского социологического центра Российской академии наук, Санкт-Петербург, Россия; Национальный исследовательский университет «Высшая школа экономики», Москва, Россия

Цитирование: Максимова А.С. (2019) Опыт пользователя телефонной справочной службы: взаимодействие с оператором-человеком и роботом. Журнал социологии и социальной антропологии, 22(6): 44-68. https://doi.Org/10.31119/jssa.2019.22.6.4.

Аннотация. Для социальных исследований технологий одна из актуальных тем — что происходит, когда деятельность, в прошлом осуществлявшаяся людьми и с помощью доцифровых артефактов, начинает обеспечиваться информационными технологиями. Статья рассматривает опыт пользователя телефонной справочной службы и фокусируется на вопросе о том, как организована интеракционная работа в телефонном разговоре пользователя с автоматизированным оператором и оператором-человеком. Для этого применяется рамка конверсационного анализа, позволяющая в деталях рассмотреть социальное взаимодействие. Материалом для анализа стали записи телефонных звонков в справочную службу, а также данные наблюдения и бесед с сотрудниками организации. На основе обзора существующих исследований взаимодействия людей с информационными системами выделены их основные находки и идеи. Охарактеризовано взаимодействие операторов-людей и пользователей телефонной службы: операторы следуют сценарию звонка, но за счет таких коммуникативных ресурсов, как интонация, место произнесения реплики, подтверждение слов, пользователи и операторы могут достигать взаимного понимания в разговоре. С помощью таких приемов люди справляются с ограничениями и решают проблемы во взаимодействии. Далее проанализировано взаимодействие пользователей и робота. Посредством сравнения этих телефонных звонков с разговорами с обычными операторами выявлены особенности интеракционной работы участников взаимодействия в случае, когда пользователи сталкиваются с машиной. Показано, что робот действует независимо и не реагирует на ситуативные обстоятельства, делает реплики пользователей дискретными и контролирует, что и в каком месте разговора может быть сказано и считано. Тем не менее пользователи адаптируются к этим интеракционным особенностям в процессе звонка.

ключевые слова: человеко-машинное взаимодействие, конверсационный анализ, пользовательский опыт, социотехнические барьеры, микросоциология.

Статья рассматривает опыт пользователя телефонной справочной службы. Мы проанализируем, как организован телефонный разговор, в котором с пользователями взаимодействуют операторы-люди и автоматизированный оператор.

Информационные технологии внедряются в различные сферы жизни и типы деятельности, в том числе они призваны обеспечить более эффективную работу сферы услуг — автоматизировать регистрацию обращений и унифицировать выдачу информации, релевантной запросам, позволить действовать дистанционно, сделать услуги доступными в удобном режиме, «разгрузить» людей от обязанностей, связанными с монотонными и однообразными операциями. В случае сферы услуг пользователи представляют обратную сторону процесса автоматизации — им приходится сталкиваться с технологическими нововведениями там, где до этого они взаимодействовали с привычными и понятными им артефактами и людьми.

Сегодня много говорится о цифровых навыках, компетенциях, которыми должны обладать люди, для того чтобы успешно справляться с повседневными, рабочими, образовательными задачами в современном мире и эффективно использовать богатый потенциал цифровых технологий. В то же время, как правило, компетенции характеризуются лишь в наиболее общих чертах. Вопрос, требующий социологического анализа, — как умения формируются и реализуются в существующих действиях. Для понимания того, что значит быть пользователем новых технологий и успешно обращаться с новыми цифровыми агентами, важно рассмотреть, как происходит взаимодействие с ними. Чему именно людям приходится учиться? Какие появляются формы и приемы коммуникации, какие «обязанности» и коммуникативные задачи берут на себя пользователи? Ответ на эти вопросы позволит обнаружить проблемы и потенциальные пути преодоления барьеров в функционировании цифровых технологий.

Статья представляет результаты проекта по изучению телефонной справочной службы. Задачи проекта — понять, как происходит внедрение автоматизированной системы вместо человеческих операторов, как эти изменения влияют на существующие способы взаимодействия и работу операторов, как разрабатывается и трансформируется эта система, какие образы «клиента», «пользователя», «абонента», «гражданина» используются в ходе формирования технологии.

Вопрос, на котором фокусируется наш текст, — как распределяется интеракционная работа в телефонном разговоре пользователя справочной службы с автоматизированным оператором и оператором-человеком. Для ответа на него будут использоваться два типа данных. Во-первых, было

проанализировано 150 звонков в справочную службу. Около 50 звонков в корпусе данных включают «живого» оператора, остальные — разговоры с автоматизированным оператором (или «роботом», как мы будем называть технологию далее)*. Во-вторых, в дополнение к данным звонков будет использоваться этнографическая информация — сведения о том, что входит в обязанности операторов, как их обучают и оценивают, задачи, возлагаемые на робота, и существующие в организации представления о том, зачем он нужен и как он должен работать.

Для анализа взаимодействия с телефонным роботом мы воспользуемся методологией, предложенной в рамках конверсационного анализа. Ограниченность голосового интерфейса предоставляет удобную возможность рассматривать разговор как достаточно автономный процесс взаимодействия. Для этого нет необходимости интервьюировать участников, наблюдать, что происходит в месте, из которого звонит человек, уделять внимание широкому контексту справочной службы. Хотя для некоторых целей может быть релевантным задаваться вопросами о внутренних, вычислительных процессах системы, поскольку нас здесь интересует перспектива пользователя, мы можем сосредоточиться на публичных, доступных ему/ей действиях машины. В конверсационном анализе разговор понимается как упорядоченный, последовательный, являющийся совместным достижением социальный порядок (Сакс, Щеглофф, Джеф-ферсон 2015; Sacks 1992). Собеседники реагируют друг на друга, отслеживают процесс восприятия, формируют свои реплики с учетом того, как их слушает собеседник, как выстроены его реплики. Сбои, ошибки, непонимания и недопонимания исправляются при помощи различных приемов. Порядок разговора наблюдаем: мы можем указать в данных на то, как разговор ситуативно создается его участниками.

Для того чтобы описать интеракционную работу пользователей и операторов, человеческих и автоматизированных, мы вначале рассмотрим существующие исследования взаимодействия с информационными системами и их основные находки и идеи. Затем будет охарактеризовано взаимодействие операторов-людей и пользователей: мы обратим внимание на то, какие условия операторы должны учитывать в ходе своей деятельности, какие проблемы возникают и как они справляются с ограничениями и решают проблемы во взаимодействии. После этого проанализируем

* Автоматизированный оператор представляет автономно работающую программу, но не «робота» в строгом смысле слова. У него нет физического «тела», корпуса, для пользователей он представлен лишь звуковыми реакциями на их реплики.

взаимодействие пользователей и робота. Посредством сравнения этих телефонных звонков с разговорами с обычными операторами мы выявим, каковы особенности интеракционной работы участников взаимодействия в случае, когда пользователи сталкиваются с машиной.

Исследования человеко-машинного «разговора»

Компьютерные системы выполняют множество задач и во многом упрощают жизнь, однако они же ставят новые задачи и вызывают трудности. Во взаимодействии с цифровыми технологиями проявляется проблема, которая не просто свойственна «некачественным», недоработанным системам, а лежит в основании технологий. Концептуальные ресурсы социальной науки могут помочь понять, в чем причины этой проблемы и как люди и машины справляются с ней на уровне повседневного социального взаимодействия.

На протяжении последних десятилетий исследователи науки и технологий занимались изучением модели действующего/пользователя в дизайне компьютерных систем и области взаимодействия «человек — компьютер». Одной из линий критики был призыв учитывать ситуативный характер социального действия, упорядоченную, контингентную организацию повседневного взаимодействия, в частности разговора (Suchman 2006).

В своей классической работе Люси Сачмен использовала подход, развитый в рамках этнометодологии и конверсационного анализа, для изучения процесса взаимодействия новых, неопытных пользователей с копировальным аппаратом. Сачмен рассматривает посылку, на которой основан дизайн в области человеко-машинного взаимодействия и искусственного интеллекта, заимствованную у когнитивных ученых: человеческому действию предшествует разработка плана, а само действие представляет последовательную реализацию этого предварительно заданного плана. Сачмен утверждает, что действие ситуативно и не может быть описано как план, следовательно, взаимодействие с цифровыми устройствами, созданными под руководством этой идеи, неизбежно несет в себе потенциальные сбои. Пользователь не имеет доступа к внутренним процессам машины и к проектировочным основаниям тех или иных решений, а машина, в свою очередь, не обладает способностью распознавать детали пользовательской ситуации за пределами тех индикаторов действий пользователя, которые считываются датчиками. Компьютер не может сообщить пользователю о своем непонимании. Более того, учитывая ситуативный характер действия, невозможно спроектировать достаточно детализированные и уточненные инструкции, которые бы обеспечивали беспроблемное взаимодействие человека и машины.

Шэррок и Баттон заявляют, что компьютерные системы никогда не смогут обрести способность говорить с людьми точно так же, как люди говорят между собой (Button, Sharrock 1995). Компьютеры, пишут авторы, всегда останутся «симулякрами разговора», сколь бы успешным и похожим на реальный разговор ни стало бы взаимодействие. Хотя аргумент о си-мулякрах был выдвинут более двадцати лет назад, в 1995 г., он по-прежнему выглядит актуальным. Несмотря на развитие компьютерных систем и достижения в машинном обучении, неконверсационная природа цифровых технологий, в том числе голосовых помощников, сохраняется.

Критика Баттона и Шэррока также касается попыток найти параллели между человеко-машинным взаимодействием и представлением о разговоре в социальных науках. Они утверждают, что считать конверсаци-онный анализ способом изучения и выявления объективных закономерностей, алгоритмов разговора или его структуры в строгом смысле неверно, что это ошибочное понимание его исходных посылок. Однако Баттон и Шэррок замечают, что методологию конверсационного анализа можно использовать для разработки и усовершенствования компьютерных систем, чтобы те стали лучшими партнерами по разговорному взаимодействию. Понимание того, как устроен разговор, может обогатить проекты по разработке голосовых интерфейсов. Социальные науки могут дать ресурсы для описания неформализуемых и неквантифицируемых свойств и явлений повседневного взаимодействия.

Порчерон и его коллеги (Porcheron et al. 2017) подчеркивают, что приложение конверсационного анализа к взаимодействию с цифровыми устройствами — не новая идея. Однако сегодня, в свете развития и распространенности голосовых ассистентов и голосовых интерфейсов вообще, стоит обратиться к этому снова. Стюарт Ривз называет такие устройства «конверсационными агентами» (Reeves 2018). Он анализирует собственный опыт взаимодействия с голосовым помощником Амазон Эхо и сравнивает то, что присутствует в этих диалогах, с результатами многочисленных уже проведенных исследований взаимодействия людей друг с другом. Ривз на основе этого выделяет несколько проблем. Во-первых, это формирование действия. В обычном разговоре говорящий способен сформировать действие (спросить, извиниться, потребовать), и сделать это таким образом, чтобы его собеседник распознал это проектируемое действие, но в случае с голосовым помощником постоянно приходится решать, «что я могу сказать» и «как мне это сказать», чтобы помощник распознал запрос. Во-вторых, в то время как в повседневном разговоре между людьми существует множество способов назначения следующего

говорящего, включая просто паузу, конверсационный агент почти никогда не самоизбирается в качестве говорящего. Его/ее черед должен быть вызван пользователем при помощи слова-обращения, которое строго зафиксировано и положение которого определено. Невозможно сначала задать вопрос, а затем попросить ответить на него голосового помощника, назвав его в конце реплики.

Если в обычном разговоре продолжительность пауз между репликами сведена к минимуму, здесь распространены довольно длительные паузы и наложение речи. Ривз отмечает, что взаимодействие с Эхо основано на смежных парах «вопрос— ответ» (или запрос/выдача, команда/действие), и «ремонт» вопросов (переформулировка, дополнение только что сказанного) в разговорах с голосовым помощником встречается весьма редко, и в целом осуществить его затруднительно. В повседневной коммуникации мы то и дело обращаемся к этой возможности исправления. Наконец, Ривз подчеркивает, что человеческий разговор «успешен», помимо прочего, благодаря тому, что его участники способны организовать его как последовательность высказываний и видеть его как таковую, дополняя новые реплики к тому, что говорилось ранее, и отсылая к этому. Амазон Эхо ведет себя иначе: иногда помощник способен задать уточняющий вопрос и удержать в «памяти», о чем только что говорилось в предыдущих репликах, в других случаях устройство полностью игнорирует контекст диалога и более ранние высказывания. Современные технологии часто описываются в свете того, что они узнают нас, собирают о пользователях сведения, персонифицируют выдачу, опираясь на предыдущие действия пользователя в цифровой среде, однако этот набор разделяемой информации формируется машиной самостоятельно, невидимо для нас, а не во взаимодействии.

Телефонные звонки с участием технологических собеседников неоднократно становились предметом изучения. Одна из сфер применения информационных технологий — колл-центры, где до сих пор использовался человеческий труд. Роботы могут как отвечать на звонки, так и быть теми, кто звонит. В своем исследовании Нильс Кловайт анализирует, как устроены телефонные опросы посредством автоматизированных систем (Klowait 2017). Он обнаруживает три основные проблемы, которые приводят к получению некачественных данных (пропущенных или не соответствующих действительности ответов) и к негативному пользовательскому опыту. Наиболее очевидная из них — неспособность системы отличать ремарки, междометия, высказывания колебания, затруднения от самих ответов. Она не может «понять» комментарии респондентов «дайте подумать» или «ну...», так как единственный приемлемый ответ — соответ-

ствующий заданному шаблону предварительно внесенных вариантов. Вторая ошибка, обозначенная «ошибка убеждения», заставляет респондентов поменять свой ответ, когда их изначальный ответ не «принимается» системой. В то время как со стороны машины это происходит из-за несовпадения с предзаданными вариантами ответа, человек может подумать, что его наталкивают на определенный выбор, «правильный» ответ. Эта ошибка, таким образом, является результатом сочетания технологических сбоев и интенций, приписанных машине. Кловайт отмечает, что правила организации телефонного разговора остаются непрозрачными для респондента, и непостоянство, демонстрируемое машиной, делает непредсказуемым каждый черед: первый вопрос в анкете открытый, следующие же требуют, чтобы респонденты выслушал все предложенные варианты, и затем назвал один из них. Автор исследования предлагает в будущем изучить не только проблемы и ошибки, но и нетипичные случаи, которые показывают возможности преодоления разрывов и практики управления автоматизированными последовательностями реплик.

Поскольку поведение пользователей сложно предсказать заранее, и сейчас проводятся, и несколько десятилетий назад проводились испытания прототипов системы и решений разработчиков. Если в последних исследованиях анализируют и реальные практики пользования, и «лабораторные» практики в условиях специально организованных экспериментов, в то время когда голосовые интерфейсы еще не были распространены и по большей части находились на этапе разработки, ученые наблюдали ситуации взаимодействия при тестировании таких устройств. Ранние исследования голосовых интерфейсов фокусировались на типе тестирования, называемом «волшебник из страны Оз» (Wooffitt, McDermid 1995; Fraser, Wooffitt 1997) — это испытание системы при помощи человеческого агента, имитирующего поведение машины (так же как и волшебник, великий и ужасный, в одноименном произведении в итоге оказывается обычным человеком). У участников складывается ощущение, что они взаимодействуют с автономным агентом, однако на самом деле по ту сторону интерфейса находится человек, в реальном времени управляющий устройством. Вуфитт и Макдермид сосредоточиваются на одной проблеме во взаимодействии с голосовым интерфейсом — необходимости контролировать речь пользователя с темпоральной точки зрения, сделать так, чтобы пользователь не начал говорить раньше того момента, с которого машина готова его «слушать», т.е. распознавать реплику. Для регулирования этого был введен звуковой сигнал. В ходе анализа исследователи обнаруживают, что пользователи нарушают молчание до сигнала в случаях, когда быстро подтверждают реплику робота и когда корректируют его ошибки.

Вуфитт и Макдермид указывают на показательный парадокс голосовых интерфейсов: помимо общего принципа дизайна, создавать удобные для пользователей (user-friendly) технологии, здесь особенно сильно заметна потребность делать поведение пользователей (в данном случае речь) удобной для системы (system-friendly). Ход взаимодействия должен задавать и ограничивать действия таким образом, чтобы они могли считываться машиной. Это может быть, например, ограничение длины предложений или контроль разнообразия и сложности используемых пользователем слов, порядка и структуры высказываний. Исследователей интересует, как устроен социальный контроль такого рода, вписанный в технологии, и как он действует в ходе пользования: «Мы можем обрисовывать слабые точки в ткани социального контроля, который разработчики систем могут пытаться установить над будущими или настоящими пользователями речевых компьютерных систем» (Wooffitt, McDermid 1995: 139). Контроль ими понимается не в негативном ключе — не как принуждающий инструмент власти, а как нейтральный элемент, делающий заметным работу участников взаимодействия и способы «обживания» технологий.

Некоторые исследования того, как люди взаимодействуют с роботами, учитывают мультимодальную природу этих социальных ситуаций, и рассматривают, как людьми считываются визуальные подсказки и сигналы, как используются жесты и как речь связана с движениями тела, для того чтобы робот понял действия и чтобы понять, что делает робот (см., например: Alac 2009; Gehle et al. 2017). В случае телефонных разговоров одним из ключевых аспектов является ограниченный интерфейс и время разговора. Особая экономика времени и доступ только лишь к аудиальной информации о собеседнике составляют важные условия коммуникации. Также во внимание следует принять институциональный контекст разговора: он обеспечивает для пользователя рамку интерпретации и осмысления того, что происходит.

С точки зрения пользователей эти наблюдения означают, что им приходится действовать в ограниченной среде, соблюдать явные и неявные инструкции, предписанные машиной, осуществлять мониторинг взаимодействия на предмет эффективных и проблемных способов действия. Одним из важных аспектов человеко-машинного взаимодействия является контроль: способы ограничивать действия пользователя так, чтобы они были удобными для системы. Другой аспект — непрозрачность процессов и реакций машины, и, следовательно, стоящая перед пользователем задача раскрывать, обнаруживать для себя в ходе взаимодействия логику функционирования машины, ее возможности и слабые места, для того чтобы изменять собственные действия соответствующим образом.

Работа человеческого и автоматизированного операторов

1. Пользователь и оператор-человек: сценарий, кооперация и гибкость

Сначала необходимо прояснить, что делают операторы-люди в колл-центре и каким указаниям или правилам они должны следовать. Мы не будем останавливаться на том, что обычно включается в анализ профессиональной деятельности, — на их мотивации, квалификации, карьерных траекториях, отношениях в организации. Далее пойдет речь о том, как происходит звонок с точки зрения операторов и что при этом им необходимо соблюдать и учитывать.

Несмотря на то что каждый звонок уникален и всякий раз операторам приходится сталкиваться с новыми деталями, их речь не является спонтанной. Им даются сценарии — фразы, которые можно использовать в определенных местах разговора для достижения разных задач. Так, каждый звонок начинается с фразы «Оператор [имя], добрый [релевантное время суток], как я могу к вам обращаться?» Отклонение от сценария считается ошибкой. При мониторинге работы операторов соответствие сценарию является одной из вещей, которые оцениваются, вместе с наличием/отсутствием так называемых критических ошибок (предоставление неверной информации, грубость и т.д.) и соблюдением стандартов телефонного обслуживания. Распечатанная таблица сценариев — около 7 листов формата А4 — расположена над рабочим столом каждого оператора. Наиболее часто используемые фразы известны наизусть, но при необходимости оператор может обратиться к сценарию за нужной подсказкой (например, когда звонит иностранец).

Кроме того, что некоторая информация о звонке записывается автоматически (так же как и сам разговор), операторы должны внести дополнительные данные в специальную форму. Но помимо такого учета обращений, их основной задачей все же является ответ на звонок и предоставление абоненту нужной справки. Для последнего операторы пользуются информационной системой — базой знаний, в которой содержатся инструкции для возможных обращений абонентов. База представлена в виде ответов, которые можно зачитать задающему вопрос. После того как оператор слышит запрос звонящего, он или она вносит ключевые слова в поисковое окно, чтобы найти нужную статью. Страница ответов иногда содержит несколько вариаций, зависящих от дополнительных условий. Например, необходимый набор документов или правила могут применяться к заявителям с определенным статусом, возрастом, местом проживания или регистрации.

Обычно абоненты не являются экспертами в той области, по поводу которой звонят. Поэтому работа оператора напоминает работу терапевта,

который, выслушивая рассказ пациента, сформулированный в повседневных выражениях, должен выделить важные симптомы, поставить диагноз и назначить верный курс лечения. В случае справочной службы, однако, не предполагается, что операторы знают ответ: они пользуются базой знаний, содержащей актуальную информацию о деятельности городских служб и государственных органов. Хотя существуют частые, повторяющиеся запросы и те, кто на них постоянно отвечает, уверенно ориентируются в информации, в действительности операторам даже не разрешается вести себя так, будто они знают ответ. Они обязаны обращаться к интегрированной базе ответов, так как содержащиеся в ней статьи могут измениться в любой момент вследствие введения новых правил, изменения работы государственных органов или других обстоятельств.

Правило, связанное с описанным выше, диктует операторам не отвечать на запросы абонентов своими словами, а зачитывать ответы из базы знаний дословно или лишь с небольшими изменениями. В основе этого правила лежит идея о том, что трансформация статьи из базы (сокращение, использование других синонимичных слов, выбор только наиболее «важных» или «информативных» фрагментов) может привести к неверной интерпретации ответа или искажению информации при передаче. В итоге пользователь, обратившийся в справочную службу, может получить неверную информацию. Исходя из этого, ответственность за понимание полностью перекладывается на абонента, вместе с риском ошибочного толкования, пропуска каких-то элементов мимо ушей или недопонимания. Операторы воспроизводят ответы из базы знаний, и даже в случаях, когда абоненту что-то непонятно и тот переспрашивает, просит пояснить или спрашивает подтверждения собственной интерпретации сказанного, формально оператор имеет возможность использовать только тот же самый ответ. Любопытно, что робот в этом плане — образцовый работник справочной службы. С точки зрения логики данной организации робот безотказно выполняет инструкцию дословно воспроизводить ответы на запросы пользователей, и в его случае помехами рискуют стать только технические сбои, вызывающие искажение предоставляемой информации.

Помимо того, что оператор-человек должен выполнять много задач одновременно, порой требования и правила, регулирующие его работу, противоречат друг другу. Операторам нельзя отклоняться от сценариев или формулировок, предлагаемых базой. Им может быть нужно уточнить вопрос или они могут предполагать, что информация в базе данных, зачитываемая ими, сформулирована непонятно. Звонок при этом должен быть коротким, поскольку продолжительные звонки означают меньшую продуктивность сотрудника и более длительное время ожидания для зво-

нящих на линии. Звонок должен быть эффективным не только с той точки зрения, что необходимые детали звонка были зарегистрированы и был дан какой-то ответ. Эффективность предполагает также, что клиент должен повесить трубку удовлетворенным: получив полный, релевантный и корректный ответ на свой вопрос и довольный вежливостью и компетентностью оператора.

Хотя менеджеры колл-центра, оценивающие работу операторов, постоянно действуют в связке с ними, чтобы пересматривать инструкции, получать обратную связь, обновлять сценарии и базу, операторы все равно часто сталкиваются с затруднительными ситуациями. Например, они могут обнаружить, что для того, чтобы сделать звонок короче или предоставить действительно полезный и понятный ответ, им нужно сократить или перефразировать информацию, а не повторить ее, как предписывает инструкция. Или они могут выяснить, что тщательное следование сценарию приведет к тому, что их реплики будут звучать невежливо.

Несмотря на то что работа операторов основана на соответствии сценарию и алгоритмична, они разрабатывают ситуативные способы предотвращать или исправлять сбои и выполнять предписанные им правила. При этом они не меняют предзаданные формулировки и их последовательность: достигать нужных результатов помогает способ произнесения реплик, в том числе интонация и тайминг.

Так, в самом начале разговора перед оператором стоит задача не только представиться и поприветствовать абонента, но и узнать имя звонящего. Для этого в конце первой реплики есть вопрос «как я могу к вам обращаться?» Практически во всех проанализированных звонках разные операторы, не меняя формулировки, произносят эту фразу с заметным интонационным выделением слова «вам». Тем самым они делают дополнительный акцент на первой части смежной пары, второй частью которой должно быть имя абонента. Отсутствие этого ударения привело бы к тому, что абоненты отвечали на приветствие, но имели бы возможность пропустить вопрос об имени.

1 О специалист Елена, добрый день, как я могу к вам обращаться?

2 А Елена, добрый день, м:еня зовут ^Татьяна

3 О Татьяна чем я могу вам помочь

Фрагмент 1, из записи ЧО3 59

Другая ситуация, в которой оператору приходится уделять особое внимание контролю над ходом разговора, происходит после получения

справки. Абонент, услышав нужную информацию, как правило, быстро сворачивает разговор — благодарит оператора и прощается. Операторам, однако, важно, чтобы клиенты справочной службы приняли участие в оценке качества обслуживания (или по крайней мере важно озвучить просьбу это сделать), и перед ними стоит задача успеть произнести соответствующую фразу до окончания разговора. Для этого они начинают свой черед, не дожидаясь завершения слов абонента. Два примера использования такого приема можно видеть ниже, в фрагментах записей ЧО20_32 (наложение реплик в строках 1-2) и ЧО17_41 (строки 1-2, 3-4).

1 А ага всё пасиба вам большое [пасиба]

2 О [уточните пожа]луйста Дарья

3 <я могу вам еще чем-то помочь>

4 (0.6)

5 А не::т спасибо большое=

6 О =оставайтесь [пожалуйста на] линии

7 А [*всё я поняла*]

8 О для оценки сервиса нашей службы спасибо вам за звонок Фрагмент 2, из записи ЧО20_32

1 А угу. все, [спасибо больш-]

2 О [>еще могу чем-то помочь?<]

3 А нет, нет, спасибо большое, до свид[ания!

4 О [оставайтесь]

5 пожалуйста на линии для оценки сервиса нашей службы,

6 спасибо вам за звонок, до | свидания Фрагмент 3, из записи ЧО17 41

2. Пользователь и оператор-робот: контроль и нечувствительность к ситуативным обстоятельствам

Автоматизированная система была введена в справочной службе летом 2017 г. и наделена ограниченной экспертизой — ей были отданы ответы в определенной области знания. Вначале задачей робота было давать справки о графике отключения горячего водоснабжения в разных районах города и предоставлять контактную информацию центров государственных услуг. В случае иных запросов робот перенаправлял звонок на оператора. При этом робот не кооперировался со своими человеческими коллегами: пользователи, попавшие на человека после звонка роботу-оператору, были вынуждены заново повторять свой запрос, так как эта информация не передавалась оператору автоматически.

На момент сбора данных экспертиза робота была расширена. Его создатели, однако, утверждали, что главная цель текущего взаимодействия системы с абонентами — техническая — прежде всего не качественное обслуживание пользователей, а обучение машины. Планировалось, что в будущем робот не заменит людей, но будет дополнять их работу, и человек-оператор будет перенаправлять абонентов на робота, как только поймет, по какому поводу те обращаются в справочную: роботу отдадут простые механические запросы, например связанные с проверкой статуса заявлений на документы, где требуется найти по номеру заявления нужный документ. Таким образом, предполагалось, что будет определена особая категория запросов, на которые робот в состоянии быстро и успешно отвечать.

Главное место, где сосредоточены проблемы во взаимодействии с роботом, — начало разговора. Все абоненты слышат сообщение о том, куда они попали и что на их запрос будет отвечать виртуальный оператор, а затем просьбу «четко сформулировать свой запрос и говорить после звукового сигнала». Сигнал отмечает момент, с которого начинается распознавание речи, и будет использоваться на продолжении всего телефонного звонка, о чем может догадаться внимательный абонент. Однако независимо от содержания инструкции наблюдается пауза после первого автоматизированного сообщения. Через несколько секунд молчания робот призывает звонящего говорить при помощи фраз «не молчите» и «говорите»*. В некоторых случаях робот-оператор и абонент начинают говорить одновременно. Происходит наложение, а затем часто одновременная осечка — оба говорящих, человек и машина, останавливаются.

Несмотря на наличие того, что можно было бы назвать первой частью смежной пары — просьбы говорить после сигнала, абоненты не спешат воспользоваться своим правом голоса. Примечательно, что в случае разговора с оператором звонящие тоже слышат открывающее автоматизированное сообщение, после чего оператор-человек их приветствует и начинает разговор. Вероятно, замешательство в начале разговора в случае робота отчасти вызвано тем, что пользователь не сразу может идентифицировать, кто является его или ее собеседником. Вводное сообщение не спроектировано как часть последующего телефонного разговора. Это сообщение вводит и представляет нового участника взаимодействия, но затем этот участник не обозначает себя. Звонок в информационную службу иногда

* Надо отметить также, что молчание пользователя рассматривается роботом исключительно как тишина, в то время как в повседневном разговоре отсутствие реплики в релевантном месте имеет значение и может по-разному считываться собеседником.

требует от пользователей нескольких реплик, прежде чем они поймут, кто им отвечает и как обращаться с собеседником. Хотя вступительная запись предупреждает, кто принимает звонок, не уточняется, как именно работает оператор и что он может и чего не может делать.

Робот роботоподобен в том, что он не приветствует собеседника, его речь звучит «автоматизированной, он использует звуковой сигнал в коммуникации. В то же время он человекоподобен: он использует вежливые фразы, говорит женским голосом, и в целом его речь звучит похоже на сценарий человека-оператора, например он озвучивает развернутую фразу («уточните, готовность какого документа вас интересует», «назовите, пожалуйста, номер заявления на патент») вместо лаконичной команды. Когда звонящий напрямую просит соединить его с человеком вместо робота, тот предлагает «Извините, но я тоже могу ответить на ваш вопрос». Разработчики автоматизированного оператора оказываются в противоречивом положении: они стремятся создать удобную, приятную, учтивую, «человекоподобную» систему, способную гладко и беспроблемно участвовать в разговоре, и одновременно пытаются четко обозначить для абонента, что тот, кто отвечает — не человек.

Наличие робота в качестве участника разговора заставляет пользователей по-особому формулировать их запросы. Часть пользователей относятся к роботу так, как будто это поисковая система. Они предпочитают не формулировать свое первое высказывание в виде вопроса, а давать короткие обозначения своего запроса, вроде «готовность социальной карты», «замена водительского удостоверения», «восстановление паспорта», «налоговая служба». Некоторые запросы трудно преобразуются в команду такого рода, и тогда пользователи формируют краткие фразы, похожую на вопрос, либо сначала называют ключевые слова или ситуацию, а затем добавляют вопрос, как во фрагментах РО30 и РО2_2.

1 А ф:: (0.4) х:: (0.2) |архивная (.) копия х:: (.)

2 ордера на кв- (.)|на ком^нату х::: где ее (.) ¿получить Фрагмент 4, из записи РО30

1 А здравствуйте (0.3) я двадцать пятого (.) октября подавала

2 заявление (.) на замену ребенку (0.5) хх карты (.)

3 социальной (0.5) на сайте я не могу выяснить э: когда

4 (.) х эта карта будет ^готова (.) потому что мне пишут

5 «данные не найдены, проверьте правильность ввода реквизитов

6 запроса» (1.6) почему Фрагмент 5, из записи РО2_2

Тем не менее значительное число абонентов продолжают говорить полными фразами и использовать вежливые обороты в разговоре с роботом-оператором. В ходе разговора можно заметить, однако, что происходит «обучение» коммуникации с роботом и высказывания становятся более обрывочными (см. также: (Корбут 2018) и статью Андрея Корбута «Реакция пользователей на сбои во взаимодействии с компьютерами: социологический анализ» в этом номере «Журнала социологии и социальной антропологии»).

После реплики пользователя всякий раз проходит несколько секунд, прежде чем робот ответит. По сравнению с паузами в повседневном разговоре это достаточно долгое время. В отсутствии четких инструкций и эксплицитных свойств работы робота абоненты интерпретируют образуемые паузы по-своему и действуют соответствующим образом. Например, они расценивают молчание как требование уточнить или дополнить запрос, добавив к нему детали (см. фрагмент записи РО2_9, также фрагмент РО2_2 выше).

1 Ах:: я хотел бы узнать э: готов ли у- (.) э паспорт (0.7)

2 который я сдавал на прописку (1.3) *две недели назад* (3.0)

3 моя фамилия Петров

Фрагмент 6, из записи РО2 9

В случае нетривиальных запросов (не просто справки о получении стандартных документов или графике работы учреждений) пользователи зачастую не в состоянии вспомнить и применять в своих формулировках нужные слова, корректные названия процедур и законов и другие детали. Такие запросы напоминают рассказ о ситуации, в некоторых случаях историю, довольно запутанную и содержащую сразу несколько факторов или важных обстоятельств, которые нужны для получения нужной информации. При этом операторов-людей можно считать своего рода специалистами по диагностике. По фрагментарному описанию оператор распознает релевантную информацию. Он или она видит за повседневно, сумбурно сформулированным запросом конкретную социальную ситуацию, которая укладывается в задаваемые базой знаний схемы. Более того, операторы демонстрируют умение оперативно давать понять пользователю, что они догадались, о чем идет речь, а значит готовы выполнить запрос. В фрагменте ЧО3_59, хотя абонентка в своем запросе не упоминает девяностый год, оператор по ее описанию считывает, о чем идет речь, и успешным и эффективным образом проверяет свою догадку в строке 8.

1 А а:=не подскажете житель ХХХ области может обрат-щаться

2 в любое отделение пенсионного фонда с заявлением на перерасчет

3 пенсии (.) или м: только в то отделение где он ¿прописан

4 О перерасчет в связи с чем?

5 А а:: ну там вроде какая-то льгота сейчас появилась в связи

6 с детьми (.) у кого дети пенсионеры могут перера:-сделать

7 перерасчет своей пенсии (.)

8 О до девяностого ¿года вы имеете в виду?

9 А да=да=да

Фрагмент 7, из записи ЧО3 59

Робота, в свою очередь, тоже обучают категоризации пользователей и их запросов, но его категоризация опирается на иные основания, а главное, иным образом осуществляется в разговоре. Восстанавливать непро-говариваемое и затем в своей реплике отсылать к разделяемому фоновому знанию для установления взаимопонимания с пользователем он не способен. В этом смысле от собеседников робота требуется более значительная работа по формулировке запроса, и у них нет возможности получить подтверждение понимания — только подтверждение непонимания.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Операторы-люди отчасти освобождают пользователей от необходимости знать или помнить правильные бюрократические названия документов и формальных процедур. Абоненты все равно пытаются говорить языком официальных документов и государственных органов, но при необходимости отвечающий им человек помогает сформулировать запрос вместе с ними. Машина, конечно, настроена на то, чтобы распознавать различные возможные обозначения операций и документов, а не только единственную официально принятую фразу, но для пользователей взаимодействие выглядит так, будто сбои в разговоре являются признаком употребления ими неправильной, «непонятной» лексики. В РО_15 можно наблюдать, как пользователь преобразует запрос после фразы робота: так «комната», адекватная в обычном разговоре, превращается в более формальную и абстрактную «жилую площадь»; «преимущественная покупка» — в преимущественное право выкупа.

1 #бип#

2 (3.4)

3 А [аэ: готовность докум-

4 О [пожалуйста не молчите

5 (1.1)

6 А х:: (.) ГОТОВНОСТЬ документов ¿на отказ города от

60 Максимова А.С.

7 преимущественной покупки (0.4) комнаты

8 (4.3)

9 О уточните, готовность (.) какого документа вас интересует

10 (0.7)

11 #бип#

12 (.)

13 А х:::: (.) х::: (0.2) <о преимущественном (.) праве выкупа городом>

(.) х::: (.) ¿жилой площади

Фрагмент 8, из записи РО_15

То, как действует в ходе звонка робот, заставляет пользователей делить запрос на компоненты, выстраивая его последовательно. Ниже пользователь изначально сообщает номер заявления на карту, но потом робот указывает ему на специально отведенное в разговоре для этого место.

1 Ах: аы:: мне:::=ф:: (0.8) х:: нужно получить социальную

2 карту х: (0.7) дата (1.0) ее два- готова должна быть

3 двадцать первого (0.2) ноября (0.3) х: номер карты

4 сто тридцать один восемьсот сорок восемьдесят че ¿тыре

5 (0.2) готова ли карта

6 (4.2)

7 О назовите пожалуйста номер заявления на социальную

8 карту (.) говорите после сигнала

9 (0.4)

10 #бип#

11 (1.0)

12 А х: сто тридцать один (.) восемьдесят четыре (.) ноль

13 (.) восемьдесят четыре Фрагмент 9, из записи РО2_25

Робот не различает типы высказываний. Из-за этого пользователь обязан производить строго определенные реплики в определенных местах разговора. Так, в точке телефонного разговора, где абоненту необходимо назвать номер заявления, он не должен произносить ничего, кроме номера, и не может попросить подождать, пока нужная запись с номером найдется или уточнить, что имеется в виду. Пример такого можно видеть во фрагменте РО2_24.

1 #бип#

2 (0.9)

3 А х: э готова ли моя социальная карта.

4 (0.0)

5 О назовите пожалуйста номер заявления на социальную

6 карту говорите после сигнала

7 (0.6)

8 #бип#

9 (0.6)

10 А х: та:к щас *секунду*

11 (3.9)

12 О возможно я вас неправильно поняла назовите номер

13 еще раз по одной цифре пожалуйста говорите после

14 сигнала

Фрагмент 10, из записи РО2_24

Робот, с одной стороны, членит обращение пользователя на последовательные части (такие как предмет запроса — уточнение типа документа — номер заявления — повторение — дополнительный вопрос), с другой — делает собственные реплики и реплики пользователя цельными и дискретными. Наложения речи здесь являются ошибкой, стороны не должны прерывать друг друга или вклиниваться посреди высказывания. Если сравнить с этим телефонный разговор людей, обнаружится, что оператор-человек и пользователь, скажем, совместно производят номера документов, телефоны и адреса учреждений (см. фрагмент ЧО3_59). В случае взаимодействия людей присутствуют постоянные подтверждения, проверка, отслеживание поддержания взаимопонимания, осуществляемые через «мгм», ритм диктовки, интонации (нисходящая интонация в завершающей части высказывания, как в строке 8 ниже), повторение частей реплики другой стороной.

1 О запишете ко[нтактный номер телефона?]

2 А [да (.) конечно]

3 О восемь четыреста девяносто пять

4 А мгм

5 О девятьсот восемьдесят пять

6 А мгм

7 О ноль девять ноль восемь

8 А ноль девять ноль ¿восемь (.) спасибо большое Леночка

Фрагмент 11, из записи ЧО3_59

В примере ниже (РО2_6) абонент испытывает проблемы с трактовкой ответа робота и пытается переспросить и уточнить, что означает ответ.

Для машины место, в котором задан уточняющий вопрос, не предполагает запроса на уточнение со стороны пользователя. Здесь возможны только ответы пользователя «да» или «нет» (их вариации вроде «нет, спасибо», «повторите, пожалуйста» тоже распознаются системой). Указание робота на релевантное место дополнительного вопроса от пользователя происходит в следующей реплике; тем не менее его формулировка косвенно говорит о том, что текущая итерация завершена и робот ждет нового запроса (здесь можно вспомнить также неспособность голосового помощника конструировать разговор как длинную последовательность реплик, на которую обращает внимание Ривз в своем исследовании /Reeves 2017/):

1 О данные отправлены для изготовления социальной карты (.)

2 ожидайте получения результата (0.4) вам ^повторить

3 (0.5)

4 #бип#

5 (1.1)

6 А э- э- т- (0.7) то есть ещё не гото:ва так получается? (1.9)

7 а страховое свидетельство [( )]

8 О [если у вас] остались вопросы (.)

9 просьба чётко сформулируйте и говорите после звукового

10 сигнала

Фрагмент 12, из записи РО2_6

Пример РО2_26 демонстрирует, что реплики робота выстроены таким образом, что пользователю заметно отсутствие в разговоре «истории», выстраивающейся между его участниками и распространяющейся больше чем на две соседних реплики сторон. Строки 22 и 28 идентичны; повторение роботом ответа снова заканчивается предложением повторить, как если бы эта информация была произнесена впервые.

19 А <ОДИН (0.8) ПЯТЬ (0.4) ШЕСТЬ (0.8) СЕМЬ (0.6)

20 ОДИН (0.5) ШЕСТЬ (0.8) ЧЕТЫРЕ (0.4) |ТРИ>

21 (4.5)

22 О ваша социальная карта (.) готова (0.6) вам повторить

23 (0.5)

24 #бип#

25 (1.8)

26 А >да пожалуйста повторите< социальная карта готова?

27 (4.5)

28 О ваша социальная карта (.) готова (0.6) вам повторить

29 (0.5)

Фрагмент 13, из записи РО2 26

Рассматривая кейс робота-оператора, Андрей Корбут показывает, что непонимание в телефонном разговоре является не самоочевидной вещью, не просто отсутствием понимания, а результатом совместной работы машины и пользователя, достижением, осуществляемым в последовательности реплик и действий (Корбут 2018). В его статье описаны некоторые механизмы реагирования на непонимание. Автор замечает, что робот обладает существенно ограниченным арсеналом способов распознавать и учитывать непонимание пользователя; основная работа по реагированию на непонимание ложится на плечи пользователя (Корбут 2018: 73—74). Мы же можем добавить к этому, что сложности вызывает то, что робот демонстрирует непонимание запроса в целом: «простите, я никак не могу понять, пожалуйста, еще раз четко сформулируйте свой вопрос и говорите после звукового сигнала», «простите, я вас не расслышала», «уточните, готовность какого документа вас интересует». Хотя последняя фраза касается конкретизации документа, довольно часто в наших данных она возникает после реплики пользователя, в которой уже четко обозначен тип интересующего его документа. Соответственно, эта реакция робота вызывает у его собеседников сомнения в том, что система в принципе успешно распознает произносимое ими. В разговоре с роботом вследствие характерного для последнего обобщенного выражения непонимания пользователь сам должен определять место ошибки или неясности и исправлять их.

заключение: работа пользователя как умелое обращение с автоматизированным оператором

Изучая взаимодействие людей с антропоморфным роботом Nao, Пеликан и Брот утверждают, что несмотря на сложности в общении с роботом, люди быстро адаптируются к не слишком интеракционно компетентному и чувствительному собеседнику, подстраивая свои действия и речь под то, как функционирует технология (Pelikan, Broth 2016). Исследователи формулируют несколько рекомендаций для разработчиков, но в целом их анализ демонстрирует, что люди являются не только умелыми участниками взаимодействия — они еще способны быстро становиться умелыми пользователями, т.е. участниками взаимодействия с роботом.

Обращаясь к данным телефонных разговоров, мы показали некоторые приемы, которые позволяют осуществлять взаимодействие между

людьми и между человеком и роботом. Операторам-людям доступен широкий ряд коммуникативных ресурсов, благодаря чему они смягчают некоторые условия, заданные институциональной рамкой и отсутствием доступа пользователя к тем знаниям и информационной системе, которые открыты им как сотрудникам справочной службы. Операторы-люди способны следовать своим рабочим инструкциям, добиваясь нужных эффектов за счет одних и тех же фраз (предзаданных компонентов сценария), сказанных иначе — с другой интонацией или акцентом на определенные слова. Используя свои возможности в разговоре, они освобождают пользователя от необходимости воспроизводить четкие бюрократические формулировки, считывая запросы, в том числе не совсем корректные, путаные или фрагментарные, как целостные социальные ситуации и отсылая в своих реакциях к разделяемому знанию. В своей работе машина лишена нюансов и не способна ориентироваться на текущую ситуацию так, как это могут делать люди. Робот владеет только набором заранее заготовленных, неизменных фраз, и набором заранее предусмотренных смысловых связей. Его возможности действия — просьбы, паузы и повторения — выступают в роли механизмов, управляющих разговором. Несмотря на их негибкость, пользователи во взаимодействии постепенно осваивают этот набор способов работы робота и подстраиваются под него.

Пояснение к транскриптам

Обозначения фрагментов: ЧО — оператор-человек, РО — робот; далее код записи в базе проекта. А абонент

О оператор

ХХХ конфиденциальная информация.

момент одновременного начала накладывающихся реплик или фрагментов

момент одновременного окончания накладывающихся реплик или фрагментов

= отсутствие паузы там, где она может ожидаться

= = отсутствие паузы между репликами разных говорящих

(0.0) пауза в целых и десятых долях секунды

(.) небольшая пауза (± одна десятая секунды) внутри или между ре-

пликами

слово интонационное выделение посредством смены высоты и/или диапазона голоса

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

::: растягивание звука (длина ряда соответствует длительности рас-

тягивания)

u заметное повышение или понижение высоты голоса в последующем

фрагменте

. , ? обычная интонация

СЛОВО фрагмент, произнесенный громче окружающих его фрагментов

*слово* фрагмент, произнесенный тише окружающих его фрагментов

х вдох

ф выдох

- обрыв реплики или слова

>< фрагмент, произнесенный быстрее окружающих его фрагментов

<> фрагмент, произнесенный медленнее окружающих его фрагментов

((слово)) комментарии транскрибера

#бип# технический сигнал

Выражение благодарности

Исследование выполнено при поддержке гранта Российского научного фонда (проект РНФ № 17-78-20164) «Социотехнические барьеры внедрения и использования информационных технологий в современной России: социологический анализ».

Я также хочу поблагодарить Юлию Августис, Николая Белова, Андрея Корбута, Кристину Попову, Артема Рейнюка и Александра Широкова, с кем совместно мы делали транскрипты и обсуждали представленные данные.

Литература

Корбут А.М. (2018) «Простите, я никак не могу понять»: способы реагирования на непонимание во взаимодействии человека и робота. Laboratorium. Журнал социальных исследований, 10(3): 57-78.

Сакс Х., Щеглофф Э. А., Джефферсон Г. (2015) Простейшая систематика организации очередности в разговоре. Социологическое обозрение, 14(1): 142-202.

Alac M. (2009) Moving Android: On Social Robots and Body-in-Interaction. Social Studies of Science, 39(4): 491-528

Button G., Sharrock W. (1995) On simulacrums of conversation: Toward a clarification of the relevance of conversation analysis for human-computer interaction. In: Thomas P. (ed.) The social and interactional dimensions of humancomputer interfaces. Cambridge: Cambridge University Press: 107-125.

Fraser N., Wooffitt R. (1997) Humans, Computers and Wizards: Analysing Human (Simulated) Computer Interaction. L.: Routledge.

Gehle R., Pitsch K., Dankert T., Wrede S. (2017) How to Open an Interaction Between Robot and Museum Visitor? Proceedings of the 2017 ACM/IEEE International Conference on Human-Robot Interaction — HRI '17: 187-195.

Klowait N. (2017) A Conceptual Framework for Researching Emergent Social Orderings in Encounters with Automated Computer-Telephone Interviewing Agents. The International Journal of Communication and Linguistic Studies, 15(1): 19-37.

Pelikan H., Broth M. (2016) Why That Nao?: How Humans Adapt to a Conventional Humanoid Robot in Taking Turns-at-Talk. Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems: 4921-4932.

Porcheron M., Fischer J. E., Reeves S., Sharples S. (2017) Voice Interfaces in Everyday Life. ACM CHI Conference on Human Factors in Computing Systems (CHI 2018): 1-12.

Reeves S. (2017) Some conversational challenges of talking with machines. Talking with Conversational Agents in Collaborative Action. Workshop at the 20th ACM conference on Computer-Supported Cooperative Work and Social Computing (CSCW'17): 431-436.

Sacks H. (1992) Lectures in Conversation. Oxford: Blackwell. Suchman L. (2006) Human-Machine Reconfigurations. N.Y.: Cambridge University Press.

Wooffitt R., McDermid C. (1995) Wizards and social control. In: Thomas P. (ed.) The Social and Interactional Dimensions of Human-Computer Interfaces. Cambridge: Cambridge University Press: 126-141.

INFORMATION SERVICE USER EXPERIENCE: INTERACTION WITH HUMAN AND ROBOT OPERATOR

Alisa Maximova ([email protected])

Sociological Institute of the Russian Academy of Sciences — Branch of the Federal Center of Theoretical and Applied Sociology of the Russian Academy of Sciences (SI RAS — FCTAS RAS), Saint Petersburg, Russia; National Research University

Higher School of Economics, Moscow, Russia

Citation: Maximova A. (2019) Opyt pol'zovatelya telefonnoy spravochnoy sluzhby: vzaimodeystviye s operatorom-chelovekom i robotom [Information Service User Experience: Interaction with Human and Robot Operator]. Zhurnalsotsiologii isotsialnoy antropologii [The Journal of Sociology and Social Anthropology], 22(6): 44-68. https://doi.org/10.31119/jssa.2019.22.6.4 (in Russian).

Abstract. In social studies of technology, one of the topical issues concerns what happens when tasks and activities performed by people before are provided by information technologies. This article examines experience of a telephone inquiry service user and focuses on the question of how interaction work is organized in a telephone conversation of a user with an automated operator and human operator. To answer to this question,

a framework of conversation analysis is employed, which allows considering social interaction in details. Records of telephone calls to the reference service, as well as data from observation and conversations with employees of the organization, were material for the study. It is shown that in studies of social interaction with information systems scholars point out limitations of machine's communicative resources. Examination of call center case (interaction of human operators and users) proves that operators are capable of following a call "script", cope with organizational restrictions and solve problems in interaction using turn-taking, tone, and even speech overlaps to achieve mutual understanding with users. Then, interaction of users and robot is analysed and compared with human operators. We identify the features of the interaction work of conversation participants in cases where users encounter a machine. It is shown that the robot acts independently from its counterpart and does not respond to situational circumstances, it "detaches" user's turns and makes them separate, controls what can be said and perceived — and at which points. However, users adapt to these specific interaction features during a call.

Keywords: human-machine interaction, conversation analysis, user experience, socio-technical barriers, microsociology.

Acknowledgements

The research is supported by the Russian Science Foundation grant (RSF no. 17-7820164) "Sociotechnical barriers of the implementation and use of information technologies in Russia: sociological analysis".

References

Alac M. (2009) Moving Android: On Social Robots and Body-in-Interaction. Social Studies of Science, 39(4): 491-528.

Button G., Sharrock W. (1995) On simulacrums of conversation: Toward a clarification of the relevance of conversation analysis for human-computer interaction. In: Thomas P. (ed.) The social and interactional dimensions of human-computer interfaces. Cambridge: Cambridge University Press: 107-125.

Fraser N., Wooffitt R. (1997) Humans, Computers and Wizards: Analysing Human (Simulated) Computer Interaction. London: Routledge.

Gehle R., Pitsch K., Dankert T., Wrede S. (2017) How to Open an Interaction Between Robot and Museum Visitor? Proceedings of the 2017 ACM/IEEE International Conference on Human-Robot Interaction — HRI '17: 187-195.

Klowait N. (2017) A Conceptual Framework for Researching Emergent Social Orderings in Encounters with Automated Computer-Telephone Interviewing Agents. The International Journal of Communication and Linguistic Studies, 15(1): 19-37.

Korbut A. (2018) «Prostite, ya nikak ne mogu ponyat'»: sposoby reagirovaniya na neponimaniye vo vzaimodeystvii cheloveka i robota ["Sorry, I Cannot Understand": Ways of Dealing with Non-understanding in Human-Robot Interaction]. Laboratorium, 10(3): 57-78 (in Russian).

Pelikan H., Broth M. (2016) Why That Nao?: How Humans Adapt to a Conventional Humanoid Robot in Taking Turns-at-Talk. Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems: 4921-4932.

Porcheron M., Fischer J.E., Reeves S., Sharpies S. (2017) Voice Interfaces in Everyday Life. ACM CHI Conference on Human Factors in Computing Systems (CHI 2018): 1-12.

Reeves S. (2017) Some conversational challenges of talking with machines. Talking with Conversational Agents in Collaborative Action. Workshop at the 20th ACM conference on Computer-Supported Cooperative Work and Social Computing (CSCW'17): 431-436.

Sacks H. (1992) Lectures in Conversation. Oxford: Blackwell.

Sacks H., Schegloff E., Jefferson G. (2015) Prosteyshaya sistematika organizatsii ocherednosti v razgovore [A Simplest Systematics for the Organization of Turn-Taking for Conversation]. Sotsiologicheskoye Obozreniye [Russian Sociological Review], 14(1): 142-202 (in Russian).

Suchman L. (2006) Human-Machine Reconfigurations. New York: Cambridge University Press.

Wooffitt R., McDermid C. (1995) Wizards and social control. In: Thomas P. (ed.) The Social and Interactional Dimensions of Human-Computer Interfaces. Cambridge: Cambridge University Press: 126-141.

i Надоели баннеры? Вы всегда можете отключить рекламу.