Жиляев Владислав Олегович
ПРОГРАММЫ-СОБЕСЕДНИКИ И ИХ ПРИМЕНЕНИЕ В БИЗНЕСЕ И ОБРАЗОВАНИИ
1. ВВЕДЕНИЕ
Еще на заре компьютерной эпохи люди хотели научить машины общаться с оператором на естественном языке. Ранние системы, такие как БИЯВЬи [1], работая с ограниченным «миром кубиков» и используя ограниченный словарный запас, выглядели чрезвычайно хорошо, вдохновляя этим своих создателей. Однако оптимизм быстро иссяк, когда эти системы столкнулись со сложностью и неоднозначностью реального мира.
Данная задача породила науку - компьютерную лингвистику, включающую в себя такие разделы, как распознавание речи, синтез речи, анализ текста и т. д. В данной статье мы рассмотрим программы-собеседники (англ. СкаПетЬм или СкмЬм), которые созданы для имитации речевого поведения человека.
2. ЗАДАЧА СОЗДАНИЯ ПРОГРАММЫ-СОБЕСЕДНИКА
В 1950 г. Алан Тьюринг предложил [2] любопытный тест для проверки, является ли компьютер разумным: судья переписывается на естественном языке с двумя собеседниками, один из которых - человек, другой м компьютер. Если судья не может надежно определить, кто есть кто, считается, что компьютер прошел тест. Предполагается, что каждый из собеседников стремится, чтобы человеком признали его. Чтобы сделать тест
простым и универсальным, переписка сводится к обмену текстовыми сообщениями.
Пока что ни одна программа и близко не подошла к прохождению теста. Это объясняется тем, что такая задача считается А1-полной, то есть по сложности эквивалентной главной проблеме искусственного интеллекта - сделать компьютеры такими же умными, как люди.
Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лёбнера. [3]
Самый лучший результат в данном соревновании показала программа А.Ь.1.С.Е., выиграв тест 3 раза (в 2000, 2001 и 2004). Но даже данная программа лишь имитирует осмысленный диалог, а по факту представляет собой огромную базу вопросов и ответов.
£смс Не Ня^ефНо ои^ефемибь,
кйо еойл кйо, счийлейс^, чйо кошпью&ер-прошел Лей.
И В ШУТКУ И ВСЕРЬЕЗ
87
3. УСТРОЙСТВО A.L.I.C.E.
Давайте заглянем внутрь ALICE. «Мозг» программы представляет собой набор файлов в формате AIML (подмножество XML, язык разметки для искусственного интеллекта), разбитых на 24.000 категорий [4].
Спираль (см. рис. 1) показывает устройство «мозга», где деревья, отходящие от корня - это шаблоны вопросов, на которые ALICE способна ответить. Самые большие пучки ответов ветвятся от слов WHAT, WHEN, WHERE, WHO и т. д.
В листинге 1 представлено, как выглядит часть «мозга» ALICE.
Рис. 1
Здесь тэг <pattern> обозначает вопрос, задаваемый пользователем. В нем можно использовать символы подстановки (*, _). Тэг <template> показывает ответ, который выдает машина.
Как мы видим, ALICE лишь имитирует диалог. Ни о какой разумной деятельности компьютера в данном случае говорить не приходится. Но даже такого уровня программы находят свое применение в практических задачах.
4. ПРОГРАММЫ-СОБЕСЕДНИКИ В БИЗНЕСЕ
В какой области могли найти свое первое применение программы, способные вести ограниченный диалог с человеком? Конечно же в поддержке сервисного обслуживания и помощи при выборе продукции.
Согласно исследованиям [5] в Америке в 2004 г. покупатели сделали порядка 1,5 миллиардов звонков в службы сервиса, причем средняя продолжительность звонка - 23 секунды. И поскольку клиенты используют все более и более сложные продукты, такие как цифровые видеокамеры, их вопросы также становятся все сложнее. При этом один звонок в среднем стоит компаниям 4-5 $. Именно поэтому корпорации
Листинг 1 <category>
<pattern>AFTER PRINCE CHARLES WHO IS * </pattern> <template>Prince William.</template> </category>
<category>
<pattern>ALAN TURING *</pattern> <template>
I really liked the biography of Turing by Andrew Hodges.
</template>
</category>
<category>
<pattern>CAN I PLAY * TURING GAME</pattern> <template>
We are already, playing, <get name="name"/> </template> </category>
Программы-собеседники и их применение в бизнесе и образовании
все чаще обращаются к помощи программ-собеседников, которые намного дешевле людей из службы поддержки - одно обращение стоит порядка 10 центов. Примерно 300 корпораций поставили себе на сайты подобные компьютерные агенты с 2001 по 2005 год.
Новым лицом известной компании Ikea стала программа Анна (рис. 2) [5], представленная красочно нарисованной улыбающейся женщиной. Она размещена на сайте и, используя сложную базу данных и лингвистические алгоритмы, отвечает на вопросы клиентов и помогает выбрать товар на 18 языках! Например, Анна способна показать карту на вопрос про ближайший магазин. Если она не может самостоятельно ответить на вопрос, она предлагает соединить с живым оператором. Похожий подход использовала компания AT&T [6] на своем сайте с персонажем Элли. Но он больше предназначен, чтобы сориентировать человека на сайте, показывая ему ссылки, соответствующие вопросам клиента.
Интересное применение нашла данная технология в американской армии. Корпорация «Next IT» разработала Сержанта Стара (рис. 3), который отвечает на вопросы будущих новобранцев. В основном это юноши в возрасте от 17 до 24 лет, которые большую часть времени проводят в интернете. Вот какие результаты [7] показало применение данной технологии:
- время пребывания на сайте возросло с 4 минут до 16 минут,
- количество заданных вопросов возросло с 6 до 13,
- при этом Сержант смог ответить на 92% вопросов,
- в месяц он отвечает примерно на 100.000 вопросов.
Результаты, конечно, впечатляют.
Еще одним примером может служить отечественная разработка компании «Нано-семантика» - кадровый агент Настя (рис. 4) [8]. Она разработана специально для кадрового агентства, поэтому основ-
Рис. 2
Рис. 3
Рис. 4
ной упор был сделан на умении Насти рассказывать об услугах агентства, отвечать на вопросы кандидатов и подбирать вакансии из базы данных текущих вакансий компании.
5. ПРОГРАММЫ-СОБЕСЕДНИКИ В ОБРАЗОВАНИИ
Про применение чат-ботов в образовании много говорится в последнее время. Но пока в данной области используются педагогические агенты (Pedagogical Agents), которые также представляются каким-либо персонажем, но при этом не обладают естественно-языковым способом ввода.
Программы-собеседники могут выступать в роли сообучающихся, конкурентов по обучению, помощников и инструкторов. Для эффективной педагогики агент должен отвечать на вопросы, давать подсказки и объяснения, отслеживать активность и прогресс обучающегося.
К работающим решениям можно отнести систему SmartHelp от компании Apangea [9]. Она в основном применяется для обучения учеников 5-11 классов математике, но в целом пакет может быть использован и в других областях. Согласно словам вице-президента компании, система ведет от 80 до 90 процентов обучения, и «живой» учитель вызывается только в тех случаях, когда сама программа справиться не может. В настоящий момент программа обучает порядка 300 учеников ежедневно.
Интересно также отметить систему Wizard-of-Oz [10], обучавшую студентов Бернимгемского университета электроники основам программирования на языке C в
И В ШУТКУ И ВСЕРЬЁЗ
89
СлуШ&Х, KOlfA сама
мофеМ.
малика tt мех
процессе обсуждений различных аспектов языка. В ходе этого эксперимента студенты выразили удовольствие от общения с программой-собеседником, легкость взаимодействия и желание продолжать обучение с помощью данной программы.
6. ПЕРСПЕКТИВЫ РАЗВИТИЯ
На данный момент проблема развития программ-собеседников, на мой взгляд, заключается в попытке имитировать диалог, решая задачу в огромном количестве частных случаев. Необходимо решение проблемы в корне, а именно создание высокоточного семантического анализатора, который мог бы сопоставить вводимому пользователем тексту смысл в форме, понятной компьютеру. Требуется применить более глубокие научные разработки как в области теоретических основ информатики, так и в области лингвистики.
В частности, применение подхода В.А. Тузова [11] к задаче создания программы-собеседника может качественно улучшить опыт пользователя от общения и релевантность ответов, которые программа выдает. Это разрешит многие проблемы современных программ-собеседников, такие как наличие различных словоформ, синонимов и даже фразеологизмов.
Литература
1. Procedures as a Representation for Data in a Computer Program for Understanding Natural Language. MIT AI Technical Report 235, Февраль 1971.
2. Alan Turing. Computing Machinery and Intelligence. Mind, vol. LIX, no. 236, October 1950, pp. 433-460.
3. Веб-сайт проекта: http://www.loebner.net/Prizef/loebner-prize.html
4. Веб-сайт проекта: http://www.alicebot.org/
5. Веб-сайт компании: www.ikea.com/ms/en US/customer service/splash.html
6. Веб-сайт компании «AT&T»: www.allie.att.com/nlq/virtual rep.jsp
7. Веб-сайт компании «Next IT»: http://www.nextit.com/Army Success.ashx
8. Веб-сайт компании «Наносемантика»: http://www.nanosemantics.ru/project-nastya/index.shtml
9. Публикация на сайте ChatbotHUB: «Internet Taking On New Role In Education».
10. Kerly, A., Hall, P. & Bull, S. (2006). Bringing Chatbots into Education: Towards Natural Language Negotiation of Open Learner Models, in R. Ellis, T. Allen & A. Tuson (eds), Applications and Innovations in Intelligent Systems XIV - Proceedings of AI-2006, 26th SGAI International Conference on Innovative Techniques and Applications of Artificial Intelligence, Springer.
11. Тузов B.A. Компьютерная семантика русского языка. СПб.: Изд-во С.-Петерб. ун-та, 2004.
Жиляев Владислав Олегович, аспирант 2 курса отделения информатики математико-механического факультета СПбГУ.
© Наши авторы, 2007 Our authors, 2007