ИНТЕГРАЛЬНЫЕ КОМПЛЕКСЫ И ТЕХНОЛОГИИ ЖИВОГО ОБЩЕНИЯ В ИНТЕРНЕТЕ
Холкин И.И. (ihol 1 h31 @mtu-net.ru)
Московский Государственный институт Радиотехники, Электроники и Автоматики (Технический университет)
Проблемы информатизации общества, новых информационных технологий и их влияние на социальные, моральные и этические аспекты широко обсуждаются как у нас в стране, так и за рубежом [ 1 -4]. Однако, отмечая целый ряд положительных сторон, например, живого интернет-общения, помогающего людям, живущим в различных странах, лучше узнать друг друга, нельзя не заметить и отрицательные тенденции в этой области новейших информационных технологий. Достаточно, например, беглого просмотра текущих разделов "Заметки" зарегистрированных интенет-партнёров серверов il s 1 - 5.com, ils.four11.com, системы Microsoft NetMeeting, чтобы оценить существенный разрыв между сравнительно высокими техническими возможностями, которые могут предоставить современные системы живого видеообщения, и довольно низким уровнем культуры самого общения интернет-партнёров. Подробный анализ причин, порождающих этот низкий уровень культуры, выходит за рамки данной статьи. Но одна из существенных причин видится в сравнительно бедной палитре изобразительных средств, которые предоставляют в настоящее время аппаратные и программные средства живого интернет-общения.
1. Аппаратные средства живого видеообщения
Аппаратные средства живого видеообщения строятся в настоящее время по одной из следующих схем. По схеме 1 к системному блоку подключается специальная видеокамера через интерфейсную плату или через разъём шины USB. По схеме 2 системный блок дополняется платой захвата аналогового видеосигнала, через которую подключается обычная видеокамера, работающая в стандарте PAL, SECAM или NTSC. В последние годы многие производители освоили выпуск видеокарт с функцией приёма и захвата аналогового видеосигнала (TV-IN). Таковы, например, видеокарты Canopus Total3DV128 AGP, Matrox Rainbow Runner Studio for Mystique, ASUS 3D Explorer V3000 AGP и др. Использование этих видеокарт в качестве штатного видеоконтролера позволяет избежать подключения дополнительной платы видеозахвата. Следует отметить, что вторая схема обеспечивает значительно более высокое качество изображения, поскольку качество "картинки" даже средней видеокамеры значительно выше, чем качество изображения специальной видеокамеры, выпускаемой для Интернет.
2. Программные средства живого видеообщения
Палитра изобразительных средств живого видеообщения определяется в основном качеством программного обеспечения.
В последнее время все большую популярность среди массовых пользователей, подключённых к Интернету через коммутируемые или выделенные каналы связи, получили такие системы как Microsoft Netmeeting, VocalTeclPhone, Connectix, VideoPhone, VDO-Phone,
HoneyQ и др., обеспечивающие передачу интернет-партнёру живого изображения и голоса. Однако в этих системах не предусматривается возможность живого переключения независимых видео- аудио пользоовательских и TV-каналов, что в значительной степени обедняет содержание и изобразительные средства живого общения. В результате практически не востребованными при живом общении оказались фрагменты семейных видеофильмов и любительских кинофильмов, композиции из фотографий семейных архивов и цветных слайдов и т. п.
В настоящее время назрела настоятельная необходимость расширения палитры изобразительных средств живого общения за счёт широкого использования указанных материалов и разработки новых технологий их применения. Ведь умелое использование этих материалов при живом общении в Интернете способствовало бы лучшему пониманию национальных, исторических и культурных особенностей отдельных людей, стран и народов.
3. Интегральные интернет-технологии живого общения
В статье предлагается определение интегральных интернет-технологий (ИИТ) живого семейного общения, которые, кроме передачи в реальном времени подвижных видеоизображений, голоса, текста и статических изображений, позволяют обмениваться в реальном времени фрагментами видео- и кино- фильмов, композициями из цветных слайдов, фотографий и открыток, а также текущими телевизионными и радио- программами. Основные результаты работы докладывались на 1-м Международном IEEE/POPOV семинаре Интернет: Технологии и услуги 25-28 октября, 1999, проходившем в Москве [6]. В результате анализа новейших образцов продукции ведущих мировых производителей, близких к этой области, в том числе среди корпораций Microsoft, Intel, Sony, NEC , можно сделать вывод о недостаточном соответствии этих образцов указанному определению.
Наиболее близким к ИИТ живого семейного общения в настоящее время является заявленный Sony в конце 1998 года грандиозный проект Цифрового Дома (VAIO World) на основе шины IEEE 1394, в котором предполагается полное слияние аудио/видео с информационными технологиями. Однако достоверные сведения о сроках реализации этого проекта, технических характеристиках и стоимости коммерческих образцов отсутствуют. Следует также отметить разработанный корпорацией NEC в сотрудничестве с Microsoft Чип, позволяющий компьютеру связываться с нетрадиционной периферией: TV, видео, и т.д. Чип совместим со стандартом IEEE 1394 (Fireware). В 2000 году планируется произвести 55 миллионов этих чипов. Однако данные о широком коммерческом использовании указанных Чипов и технологии их применения пока отсутствуют.
Предлагаемый в данной статье подход по реализации интегральных интернет-технологий живого общения основан на разработке аппаратного интерфейсного модуля, обеспечивающего подключение в произвольной комбинации к системному блоку компьютера нетрадиционной периферии: TV, видео, аудио и т. п., через стандартные платы захвата аналогового видео/ аудио сигнала.
Заметим, что в руководствах по эксплуатации стандартных интерфейсных видео/аудио плат типа miroVIDEO DC 10 - DC30, AWE64 и т. п. содержится требование, запрещающее перекоммутацию входов/выходов указанных плат с внешней видео и аудио аппаратурой при включённом компьютере [5]. Нарушение этого требования может привести к выходу из строя буферных входных/выходных каскадов платы. Ясно, что выключение и перезагрузка компьютера делает невозможным живое переключение видео/аудио каналов в про-
цессе общения. Поэтому аппаратный интерфейсный модуль должен удовлетворять двум основным требованиям:
- живого переключения видео/аудио каналов при работающем системном блоке;
- перекоммутации видео/аудио каналов в произвольной комбинации, делающей компьютер и внешнюю видео/аудио аппаратуру единым интегральным интернет-комплексом живого общения.
Такой аппаратный интерфейсный модуль был разработан, что позволило создать действующий интегральный интернет-комплекс живого семейного общения, обеспечивающий живое переключение в произвольной комбинации и передачу интернет-партнеру информации от одного из 4-х независимых видеоканалов с живым звуком. По этим каналам могут передаваться:
- подвижные изображения лица, окружающая обстановка;
- фрагменты видеофильмов;
- фрагменты любительских кинофильмов, цветные слайды, фотографии, открытки, тексты и т.д. из старинных семейных архивов.
Именно такой информацией в большом количестве обладают в настоящее время и желают обмениваться ею в процессе живого общения большинство семей, подключенных к Интернету.
Кроме этого, возможна живая вставка любой из произвольного числа телевизионных (PAL, SECAM, NTSC) и радиопрограмм.
Заметим, что последний образец видеокамеры Intel, выпущенный специально для этих целей и поступивший в продажу в конце 1 998 г., обеспечивает передачу только подвижного изображения лица интернет-партнёра и поздравительных открыток.
В проекте Цифрового Дома (VAIO World), заявленном Sony, о возможности передачи интернет-партнеру фрагментов архивных семейных кинофильмов умалчивается.
4. Интегральный интернет-комплекс живого общения
На рис. 1 приведен один из вариантов конкретной реализации функциональной схемы действующего демонстрационного прототипа интегрального интернет-комплекса живого общения. Кроме выполнения основной функции видеообщения в Интернете, комплекс выполняет целый ряд вспомогательных функций, а именно:
- создание и монтаж видеофильмов и их видеозаписей;
- создание видеозаписей со вставкой в них фрагментов кинофильмов, цветных слайдов, фото и т. п.;
- конвертирование видеозаписей в snap- и стробоскоп- файлы и их видеозаписи;
- нелинейный видеомонтаж и т.п.
4.1. Связь по видеоканалу
Связь по видеоканалу осуществляется с помощью платы miro VIDEO DC 10. Плата miro VIDEO DC 10, являющаяся аппаратным кодировщиком/декодировщиком видео в формате Motion JPEG (MJPEG), предоставляет возможность полноценной работы с изображениями и видеопоследовательностями — видеоввод, редактирование, наложение компьютерной графики и титров, вывод на телевизор и запись на видеоленту.
Рис. 1 Функциональная схема интегрального интернет-комплекса живого общения.
При наличии звуковой платы, можно работать и со звуком — записывать, редактировать, микшировать и накладывать на видео с реальным CD— качеством. Плата позволяет записывать видео в файлы .AVI на жесткий диск компьютера и проигрывать их на экране телевизора либо записывать их на видеомагнитофон, обеспечивая качество VHS и S-Video. Плата miroVIDEO DC 10 подключается к любому источнику или приемнику видеосигнала, работающему с композитным видеосигналом (форматы VHS и Video S) или с сигналом в формате -Video (S-VHS, HiS).
Для компрессии видеоданных используется аппаратный MJPEG компрессор реального времени. Передача данных осуществляется через 32-битную шину PCI Bus Master. Плата осуществляет захват изображения с разрешением 3S4 х 57б точек при 50 полях в секунду (PAL/SECAM) и 320х 4S0 х б0 полей (NTSC). При таком разрешении видео хранится в файле, а при выводе на телевизор или на видеоленту плата достраивает вторую горизонтальную половину кадра до разрешения 76S х 57б (б40 х 4S0), что обеспечивает качество VHS и S-Vldeo. Плата работает с телевизионными стандартами:
- PAL (Европа, Бразилия и np.)/SECAM (Россия, Франция) — б25 линий и 50 полукадров;
- NTSC (США, Япония) — 525 линий и б0 полукадров.
Файлы .AVI могут содержать видеопоследовательность как с применением компрессии Motion JPEG (плата miroVIDEO DC 10), так и программной (Cinepak, Intel Indeo, Microsoft Video 1 и др.) компрессии. В отличие от файлов .AVI с Motion JPEG компрессией, которые не будут проигрываться без платы miroVIDEO DC10, файлы с программной компрессией можно переносить и воспроизводить на компьютере, не оснащенном платой miroVIDEO DC 10.
4.2. Связь по аудиоканалу
Связь по аудиоканалу осуществляется через Sound BlasterAWE64. Плата AWE64 обеспечивает создание .WAV-файлов с качеством CD, что позволяет совместно с Mini HiFi Component System FH - GS0 просматривать видеофильмы с воспроизведением звука качества Hi - Fi - Stereo. В то же время наличие у этой платы, кроме линейного, микрофонного входа позволяет в процессе передачи видеофильмов интернет-партнёру сопровождать их содержание комментариями.
4.3 Системный блок
Системный блок выполнен на базе процессора Pentium II. Видеоконтроллер ATI Expert c TV-Out позволяет записывать сеансы общения на видеомагнитофон.
4.4. Видеокамера NV - S600EN и дополнительное оборудование
Видеокамера VHS NV - S600EN позволяет, наряду с передачей видеоизображения в процессе общения, создавать качественные видеофильмы со стереофоническим звуком Hi
- Fi. Используя сканер MicrotekScanMaker 330 и засинхронизированный Кинопроектор 8П-1, можно оживлять видеосюжеты вставкой слайдов, фотографий, кинофрагментов в соответствующие места видеофильмов. Цветной принтер HP DeskJet 690C+ позволяет распечатывать цветные VideoCaptures, полученные в процессе живого общения.
4.5. Видеомагнитофоны
Видеомагнитофоны NV - HD100EE и SLV - X57ME обеспечивают запись сеансов видеообщения, воспроизведение видеозаписей и вставку их в процессе живого общения, а также создание качественных видеофильмов.
4.6. Аппаратный интерфейсный модуль
Аппаратный интерфейсный модуль осуществляет коммутацию в различных комбинациях порядка пятидесяти линий, связывающих компоненты интегрального интернет-комплекса, реализуя различные технологии живого общения и подготовки видеоматериалов.
4.7. Модем COURIER V.34Fax
Модем COURIER V.34Fax обеспечивает связь с провайдером Интернет по выделенным или коммутируемым каналам связи.
5. Программное обеспечение
Качество и состав программного обеспечения интегрального интернет-комплекса живого общения в значительной степени определяет его интеллектуальную мощь, а также палитру и выразительность средств живого общения. Перечислим основные компоненты программного обеспечения, которые могут использоваться в подобных комплексах.
- Microsoft NetMeeting 2.1- 3.1 - обеспечивает живое видеообщение с передачей звука, файлов, текстов, статических изображений.
- Ulead MediaStudio Pro 5.2 - мощный пакет подготовки видеоматериалов и нелинейного видеомонтажа, включающий модули: Video Capture, Video Editor, Video Paint, CG Infinity, Audio Editor.
- Professor Franklin's Instant Photo Artist 1.01 - пакет подготовки и редактирования фотографий, рисунков и других статических изображений.
- PROMT 98 - перевод в Интернете с полным сохранением форматирования Web -страниц.
- QUALCOMM's PureVoice 1.1- создание и передача звуковых файлов в весьма сжатом виде.
6. Интегральные технологии и сценарии живого общения
Основным фактором, ограничивающим палитру изобразительных средств живого общения, является невысокая пропускная способность канала связи. Ограничения пропускной способности условно можно разделить на два класса. К первому классу относятся ограничения каналов, соединяющих интернет-партнеров со своими провайдерами. Второй класс ограничений обусловлен перегруженностью магистральных спутниковых или оптоволоконных каналов, соединяющих самих провайдеров.
Известно, что большинство интернет-партнеров, пользующихся услугами живого общения, подключены к модемным пулам своих провайдеров через коммутируемые телефонные каналы. Пропускная способность таких соединений, как у нас в стране, так и за рубежом, колеблется в пределах от 14.4 Kbps - для старых телефонных линий с изношенным оборудованием, до 112 Kbps - для современных Dual ISDN (Integrated Services Digital
Network) цифровых телефонных сетей с комплексными услугами. Ограничения первого и второго классов влияют на качество живого общения по-разному. Ограничения первого класса являются в некоторой степени контролируемыми. По крайней мере, интернет-партнер, сделав несколько пробных интернет-контаков, имеет возможность выбрать максимальную скорость, на которой связался его модем. Для наших отечественных телефонных линий она обычно лежит в пределах 19.2 -33.6 Kbps. Следствием ограничений первого класса является появление задержки при передаче речевых сообщений, которая может достигать нескольких секунд, и увеличение длительности построения видеоизображения на приемном конце. На ограничения второго класса интернет-партнеры повлиять практически не могут, поскольку они зависят от множества, в основном, случайных факторов. Ограничения второго класса проявляются в длительных паузах (провалах) при передаче речевых сообщений и зависании процесса построения видеоизображения. В составе программных средств систем живого общения обычно имеются специальные утилиты, позволяющие измерить указанные искажения. Так, например, Intel Conection Advisor, входящий в состав системы Microsoft NetMeeting позволяет контролировать загрузку процессора, а также скорости передачи, задержки, потери звука и видео. Имеются также средства, позволяющие в определенных пределах уменьшить эти искажения. Так в Microsoft NetMeeting при недостаточной пропускной способности канала можно переходить с дуплексной на однонаправленную аудио связь, уменьшать размер передаваемого видеоизображения с (90х145) до (45х55) и (25х40) мм, повышать качество изображения за счет уменьшения частоты кадров. Однако всех этих мер бывает недостаточно для обеспечения приемлемого качества живого общения. В этом смысле интегральные технологии и интегральные интернет-комплексы живого общения обладают большими возможностями. Существует мнение, что при жестких ограничениях, обусловленных телефонными линиями, через которые массовый пользователь подключен к Интернету, вряд ли можно в настоящее время серьезно ставить вопрос о передаче видеоизображения в процессе живого общения. Действительно, емкость видеоканала должна в сотни и тысячи раз превышает емкость аудио канала, но тогда, когда видеоизображение передается с частотой 1 5 - 25 кадров в секунду.
Длительный опыт живого общения с отечественными и зарубежными интернет-партнерами показал, что для удовлетворительного качества речевого общения, когда ему отдается приоритет, доля видеосигнала не должна превышать порядка десяти процентов от аудиосигнала. Но даже в этих условиях можно осуществлять качественную передачу видеоизображения. Дело в том, что для психологически комфортного восприятия видеоизображения, более важным параметром является не высокая частота смены кадров, которой в этих условиях все равно нельзя достичь, а отношение длительности построения видеоизображения к длительности экспонирования его на приемном конце. Желательно, чтобы значение этого отношения не превышало величины порядка 0.2. При этом частота смены кадров может составлять 0.1 - 0.01 Гц. При обмене видео- и архивными кинофильмами, когда приоритет отдается передаче изображения, а не звука, доля аудиосигнала не должна превышать порядка десяти процентов от видеосигнала. При этом частота смены кадров может быть повышена. А сами фильмы следует передавать в виде snap- или стробоскоп-файлов, в которых частота смены кадров лежит в пределах 1 - 0.1 Гц. Однако ни одна из перечисленных выше коммерческих систем живого общения не может обеспечить таких значений параметров. В рассматриваемом в данной статье интегральном интернет-комплексе живого общения подобные режимы и сценарии легко обеспечиваются.
Заключение
В настоящее время назрела настоятельная необходимость в создании новых технологий живого интернет-общения и расширения палитры его изобразительных средств. Несомненным преимуществом предлагаемого подхода по созданию интегральных интернет-технологий и комплексов живого семейного общения является максимальное использование существующей аудио/видео/ТУ-техники, которой располагает в настоящее время средняя семья, подключенная к Интернету через коммутируемые или выделенные каналы связи. Это обстоятельство делает данный подход весьма привлекательным с экономической точки зрения.
Библиография
1. Koji Kobayashi. Information Society and Information Technology / International Journal of Human-Computer Interaction 3(2). New York, 1991 - P. 223-237.
2. Imai, K., Shiobara, T. & Matsuoka, S. Japanese Organizations-Organization Strategy in the Network Age. Publisher: Daiichi Hold Shuppan (in Japanese), Tokyo, Japan, 1988.
3. Kobayashi, K. A perspective on the Information age: C & C. NEC Research & Development, 56,1-7, 1980, January.
4. Кольер М., Дэвис Э. Мультимедиа: Новые стандарты и технологии. Журнал сетевых решений. - М.: 1998, том 4, номер 6. - С. 81-86.
5. MiroVIDEO DC 10. Руководство по установке и эксплуатации. АО "Цифровые Видео Системы. - М: 1997.-24с.
6. Kholkin I. Integrated Internet Technologies for life-style conversation. FIRST IEEE/POPOV WORKSHOP ON INTERNET TECHNOLOGIES AND SERVICES, PROCEEDINGS, Special Russian Session "The Internet Developments in Russia"(October 28, 1999) Moscow, Russia, p.76-80.