Научная статья на тему 'Визуализация новых социальных пространств (М. Грэм, М. Зук. «Журнал технических методов анализа прикладных вопросов урбанистики»). (рецензия)'

Визуализация новых социальных пространств (М. Грэм, М. Зук. «Журнал технических методов анализа прикладных вопросов урбанистики»). (рецензия) Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
80
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Визуализация новых социальных пространств (М. Грэм, М. Зук. «Журнал технических методов анализа прикладных вопросов урбанистики»). (рецензия)»

Д.С. Баринова

ВИЗУАЛИЗАЦИЯ НОВЫХ СОЦИАЛЬНЫХ ПРОСТРАНСТВ (М ГРЭМ, М ЗУК. «ЖУРНАЛ ТЕХНИЧЕСКИХ МЕТОДОВ АНАЛИЗА ПРИКЛАДНЫХ ВОПРОСОВ УРБАНИСТИКИ»)

(Рецензия)1

Статья Марка Грэма и Мэттью Зука появилась в год, когда большие данные (big data) были объявлены трендом ИТ-индустрии. Ее публикация совпала с началом «бума» больших данных, который мы наблюдаем в последние годы в науке, деловой прессе и бизнесе. В сентябре 2012 г. Институт Интернета Оксфорда провел первую конференцию, посвященную проблемам анализа больших данных. В октябре журнал «Harvard Business Review» вышел под заголовком «Big data». Весной 2013 г. увидела свет книга с одноименным названием «Big Data: A Revolution That Will Transform How We Live, Work and Think» [Mayer-Schönberger, Cukie, 2013] Виктора Майера-Шонбергера, профессора Оксфорда, и Кеннета Кукьера, дата-аналитика газеты «The Economist». Большие данные изучаются как академический предмет в некоторых вузах.

Авторы статьи - пионеры в области исследований Интернета и методов анализа больших данных. Мэттью Зук пишет на эту тему с 2000 г.2 Марк Грэм, его ученик и последователь, продолжает изучение кибер-ландшафтов в Институте Интернета Оксфорда. К слову, этот самый молодой институт в Оксфорде был основан в 2001 г. специально для исследования проблем больших данных. Зук и Грэм являются авторами проекта «Floatingsheep»3, где они регулярно публикуют результаты картирования и анализа геокодированных пользовательских данных.

1 Graham M., Zook M. Visualizing globalccyberscapes: Mapping user-generated place-marks // Journal of urban technology. - Brooklyn, NY, 2011. - Vol. 18, N 1. - P. 115-132.

2 Список всех работ Зука см.: http://www.zook.info/MatthewZook-cv.pdf (Дата обращения: 14.09.2014.)

3 Floatingsheep. - Mode of access: http://www.floatingsheep.org/ (Дата обращения: 14.09.2014.)

452

Гибридные пространства (как новое социальное явление): Проблемы концептуализации

В качестве предпосылки для своего исследования Зук и Грэм называют проект Google Flu Trends1, запуск которого состоялся в ноябре 2008 г. Проект Google использует поисковые запросы как показатели распространения вируса и визуализирует полученные результаты в виде интерактивных графиков, чтобы отслеживать в режиме реального времени всплески и падения эпидемии гриппа в разных странах мира (в мае 2013 г. проект предоставлял данные о 29 странах). Преимущество такой визуализации, как утверждают в Google, в том, что она позволяет выявлять первые признаки начала эпидемии на 7-10 дней раньше, чем это делают официальные эпидемиологические службы, поскольку люди начинают искать в Интернете описания своих болезней при первых же симптомах, еще до того как обратиться к врачу.

По мнению Зука и Грэма, запуск сервиса Google Flu Trends обозначил важный сдвиг в восприятии человеком информации в Интернете и восприятии материального мира. Сервис позволяет анализировать материальный мир, используя данные коллективного разума, накопленного в Интернете.

Эти новые тенденции, пишут авторы статьи, ставят перед учеными и новые вопросы. Что можно узнавать о социальном мире из анализа агрегированных данных о деятельности интернет-пользователей? Насколько сильны связи между репрезентациями мест в Интернете и этими же местами в реальном мире? Как изучать эти связи для целей социальных наук? Сами авторы пытаются на них ответить, выбрав в качестве объекта своего анализа Google Maps, популярный онлайн-сервис визуализации социальных данных.

Сложность анализа «веб 2.0»-карт, каким является сервис Google Maps, состоит в том, что эти сервисы агрегируют огромные массивы пользовательских данных, и подвергать анализу эти объемы данных крайне сложно. Авторы приводят статистику по количеству загружаемых в Интернет данных: в 2012 г. в Википедии было размещено около 0,5 млн геотегги-рованных мест, около 10 млн меток - на Викимапии, 800 млн GPS-меток загружено на сервис Open Street Map и почти 10 млн геометок - на Google.

Авторы предлагают свою методологию, которая позволяет определить, какие места аннотированы на картах типа веб 2.0.

Во-первых, они вводят понятие «киберландшафты» (cyberscapes), т.е. тип, количество и качество геокодированных данных о реальном месте, размещенных в Интернете. Это так называемые «виртуальные тени» (virtual shadows) материальных мест, состоящие из бесчисленных отметок

1 Следите за распространением гриппа в мире. - Mode of access: http://www.google. org/flutrends/ (Дата обращения: 14.09.2014.)

453

на картах Google, из статей в Википедии, геотегированных фотографий на Flickr - и любая другая метаинформация о месте, которую можно получить, находясь за границами этого места. (Сегодня в этот перечень можно добавить данные, загружаемые пользователями на сервисы Foursquare и Instagram.)

Второе понятие, которое авторы вводят, - это «digiplace» («дижип-лейс»). Термин не имеет аналогов в русском языке. Если прибегнуть к описательному способу толкования, то digiplace - это наше восприятие места, создаваемое тем, как киберландшафты влияют на наше понимание места и взаимодействие с ним. В этом процессе важную роль играет момент видимости или невидимости отдельных мест на цифровых картах. На наше восприятие дижиплейс также влияют технические приборы, через которые мы получаем информацию о местах: компьютеры, телефоны, планшеты. Digiplaces формируют и то, в каких измерениях киберланд-шафтов и что оказывается видимо или невидимо, например, через поисковые алгоритмы, которые рейтингуют миллионы страниц сайтов.

Киберландшафты и digiplaces формируют гибридные социальные пространства. И не виртуальные, и не материальные - именно смешанные пространства, и через них происходит восприятие людьми окружающего мира. В силу новизны этих явлений их свойства и последствия влияния на человека пока не изучены. В статье Зук и Грэм пытаются задать рамки концептуализации. Для этого они берутся анализировать новые кибер-ландшафты при помощи методов картирования ряда киберландшафтов Google Maps.

Обоснование объекта исследования

Авторы выбрали Google Maps объектом своего исследования по ряду причин. Во-первых, этот сервис - лидер рынка «веб 2.0»-карт и самый популярный в Интернете. Он играет решающую роль в конструировании образов тех или иных мест у миллионов пользователей. По статистике, 50% пользователей обращаются к Google за поиском. Во-вторых, это наиболее полная база геоданных в Интернете. Google стал ключевым игроком в Интернете по созданию и распространению пользовательского геоконтента о разных точках земли. По данным на 2009 г., в базе Google было более 10 млн геометок о разных точках планеты.

Google Maps - один из лучших показателей коллективного разума. Он показывает глобальную картину киберландшафтов, совокупность всех описаний, эмоций и комментариев пользователей о разных местах на планете. Конечно, у пользователей в разных странах есть свои предубеждения о том или ином месте, и это неизбежно отражается на эмоциональных и содержательных описаниях об этом месте на киберкартах.

Несмотря на существующие в разных странах стереотипы и предубеждения, авторы доказывают важность результатов поиска по ключевым

454

словам в определенной точке на Google Maps (дижиплейс), создаваемых поиском по киберландшафтам на Google Maps. В процессе поиска создаются новые цифровые палимпсесты пространства, и через эти цифровые места, визуализируемые на Google Maps, люди формируют свое представление о мире.

Создание базы данных

Сбор данных о киберландшафтах Google Maps происходит при помощи специального скрипта. Программа осуществляет поиск в базе Google Maps геометок, содержащих определенные ключевые слова, и собирает количество результатов по каждому конкретному запросу. Эти результаты - показатель интенсивности пространственных данных в данном месте по сравнению с другими местами. По ним ученые могут проводить анализ присутствия места в геопространстве данных. Этот показатель лежит в основе всех карт, создаваемых Зуком и Грэмом.

Сбор данных для получения результатов, представленных в статье, проходил в период с 2008 по 2009 г.

В целях исследования анализ Google Maps проходит по четырем ключевым переменным:

NEAR - местоположение на карте, по которому идет геопоиск. Переменная NEAR состоит из пар координат (широта и долгота) на поверхности земного шара, включая Антарктиду. Всего около 260 000 точек;

Q/QUERY - ключевое слово, запрос по которому Google соотносит с имеющимися в его базе геопространственными данными (например, слово «боулинг» или «церковь»);

RADIUS - расстояние от основной точки (NEAR), в радиусе которой осуществляется поиск (например, 24 км);

MRT - тип поиска, например, по базе Google Maps Directory, справочный онлайн-каталог или только по пользовательскому контенту, проиндексированному Google Maps.

Например, поиск по запросу: координаты точки 38°N, 84°W, в радиусе 10 км, по ключевому слову «1» (единица), в пользовательском контенте дал 3128 результатов. Эта цифра - главная единица измерения, которую собирает автоматизированный код.

Чтобы составить точную картину распределения пользовательского контента в мире, в ходе проекта систематически измерялись значения для четырех основных переменных. Задача состояла в том, чтобы охватить поверхность Земли и избежать дублирования смежных точек. В некоторых случаях этого избежать не удалось, поскольку алгоритм поиска Google Maps работает по окружности и не может быть изменен под другие геометрические фигуры. Переменная QUERY состоит из длинного списка ключевых слов и в теории безгранична. Нужно учитывать искажения, свя-

455

занные с лингвистическими особенностями. Например, поиск по слову coffee выдает меньше результатов в неанглоязычных странах (Германия, Франция), в странах, где не используется латиница (Китай, Япония), или странах с иными культурными предпочтениями (Великобритания). Чтобы минимизировать подобные лингвистические искажения, Грэм и Зук используют максимально интернациональные слова, как секс, бизнес, Библия и др. В качестве прокси для обозначения общего количества пользовательского контента, привязанного к одной геоточке на Google Maps, ученые используют поисковый запрос «1» (цифра один).

Цели исследования

По словам авторов, целью статьи является изучение глобальных ки-берландшафтов в двух измерениях.

Во-первых, это продолжение исследований неравномерных (асимметричных) кибергеографий. Ученые проверяют, до какой степени это разнообразие и неоднородности сохраняются и на уровне пользовательского контента. Делается предположение о сохранении неоднородностей в репрезентации мест и в Google Maps.

Во-вторых, это более глубокое изучение киберландшафтов через картирование границ (определение контуров) использования отдельных ключевых слов. Визуализация киберландшафтов, по мнению авторов, помогает более полно изучить связи между виртуальным и реальным измерениями, гибридные пространства, с которыми взаимодействует человек.

Неравномерные географии глобальных киберландшафтов

По мере того как земная поверхность на картах Google покрывается миллионами пользовательских меток, информация об одном и том же месте постоянно обновляется и изменяется. Видимость или невидимость в физическом пространстве все больше определяется количеством его упоминаний, его рейтингом, присутствием в онлайн-данных. Грэм и Зук делают предположение о том, что некоторые модели восприятия кибер-ландшафтов (диджиплейсы) имеют потенциал к тому, чтобы стать реальными, учитывая тенденцию к восприятию онлайн-информации как проекции реального мира. Важно, утверждают авторы статьи, изучать географию пользовательского контента в целом, анализировать то, какие места пользователи наносят на киберкарту. Как отличаются карты кибер-ландшафтов по масштабу и по темам? Дают ли данные, составляемые пользователями на онлайн-картах, точное отображение описываемого материального мира и насколько они его искажают?

456

Как показывают результаты картирования, пользовательский контент далеко не равномерно распределен на глобальном уровне. Какие-то части поверхности Земли густо усеяны онлайн-метками, а какие-то остаются без отметок. Неравномерные географии пользовательского контента - следствие неравномерного заселения планеты. И это неравенство оказывается еще более заметным на мелких масштабах. Например, район Токио описан в три раза большим количеством геоданных по сравнению с цылым африканским континентом. Впрочем, разница видна и на картах более крупного масштаба: если анализировать карту Китая, то по сравнению с количеством отметок в районах Пекина, Шанхая и дельте Жемчужной реки (Макао и Гонконг), остальная часть страны на онлайн-карте кажется необитаемой пустыней, «белым пятном» без геометок. Эти примеры говорят о том, что киберландшафты разнообразны и богаты пока лишь в отдельных кластерах виртуального информационного пространства. Эту особенность киберландшафтов также важно учитывать при анализе визуализации пользовательских геоданных.

Ученые задаются вопросом: может ли анализ киберландшафтов помочь выявить особенности различий между местами или же они лишь показывают имеющиеся различия между местами с большим количеством подключений к Интернету и местами с меньшим количеством подключений?

Результаты картирования киберландшафтов по ключевым словам

Зафиксировав все вышеперечисленные особенности кибергеогра-фий, Зук и Грэм провели серию поисковых запросов по ключевым словам. В качестве поисковых запросов были выбраны интернационализмы, дабы минимизировать возможность искажений результатов в связи с лингвистическими особенностями в разных странах. Полученные результаты были визуализированы на картах.

Бизнес и секс

Первый этап проходил по запросам на слова бизнес и секс. Оба слова, как показали результаты, имеют свои четкие взаимосвязные географии на карте мира. В целом наибольшая концентрация меток по обоим словам обнаруживается на территории Северного полушария. Чаще всего эти слова «привязаны» на Оос^1е-карте к территории Северной Америки, Японии и Европы. По сравнению с этими территориями остальные территории выглядят довольно пустынными.

Картирование показывает, что география мест с метками бизнес более обширна по сравнению с географией мест с метками секс. Места с

457

метками секс сконцентрированы на территории Великобритании, Швеции, Германии, Нидерландов и Исландии.

При визуализации результатов по поиску секс на карте проявились страны Африки: Нигерия, Кения, Тунис, Мавритания, Замбия и Лесото. Этот неожиданный результат ученые оценивают либо как ошибочный ввиду в целом небольшого количества пользовательских геоданных об этих местах, либо же это может свидетельствовать о том, что секс - это первое, с чем у людей ассоциируются эти страны. Как бы то ни было, заключают авторы, в любом случае, необходимо провести более тщательный анализ, прежде чем делать окончательные выводы.

Библии и книжные магазины

На следующем этапе исследования ученые провели картирование результатов поиска по словам церковь и книжный магазин. Территориально поиск на карте был ограничен границами Северной Америки. Полученные данные о количестве мест с метками церковь и мест с метками книжные магазины были визуализированны на карте США. Так как церквей, по словам ученых, в Штатах значительно больше, чем книжных магазинов, то в данном случае потребовалось ввести индекс, прежде чем перейти к сравнительному анализу. Картирование геоданных по запросу церкви и книжные показало, что в целом по стране книжные преобладают на Западном побережье Америки (Лос-Анджелес и Калифорния) и в отдельных мегаполисах -на Восточном побережье, а места с метками книжный магазин на карте более заметны в таких городах, как Даллас, Сан-Антонио, Хьюстон и Нью Орлеан, т.е. на юге и юго-востоке страны.

Церковь, боулинг, оружие и стрип-клубы

Следующая серия запросов была проведена с целью проверить, как американцы проводят свободное время. После визуализации полученных результатов выявилось, что в Северной Америке преобладают места с метками церковь, боулинг, оружие и стрип-клубы. Эти метки раскрашены в соответствующие цвета, и заметно преобладание меток со словом церки и оружие. Церкви преобладают на юго-востоке страны и в центрально-западном районе. А на северо-востоке и западе США и в Канаде оказалось больше мест с метками оружие. Это не значит, замечают авторы, что в Канаде больше оружия, чем на юге США. Это следует трактовать только как то, что результаты поиска по слову церкви в Канаде и по слову оружие в США теряются в общем списке результатов запросов, а при визуализации они оказываются невидимыми на фоне других меток.

458

Места с метками «боулинг» и «стрип-клуб» на фоне результатов по ключевым словам церки и оружие также потерялись в море других запросов и оказались не видны на карте (за исключением Торонто и Лас-Вегаса).

Проанализировав результаты картирования по ключевым словам, Грэм и Зук утвердились во мнению, что такой подход позволяет анализировать культурные, экономические и политические особенности территорий, чего методологически не представлялось возможным делать ранее. Картирование пользовательских данных позволяет создавать детальные визуализациии для решения специфических задач. Изменяя ключевые слова поиска, можно получать разнообразные «снимки» киберландшафтов и проводить сравнительные анализы для изучения глобальных или локальных социальных явлений.

Пользовательские географии религий

Основной вывод, к которому приходят Грэм и Зук, это то, что появлением «веб 2.0»-карт и сервисов геотегирования у ученых появился гибкий инструмент для детального изучения социальных явлений - метод визуализации пользовательских геоданных, чего прежде не было в их методологическом арсенале. Если раньше целые континенты окрашивали одним цветом, чтобы обозначить принадлежность территории к той или иной религии, то теперь можно получать более детальные и разнообразные карты религиозных предпочтений в масштабе континента, отдельной страны или города. Настраивая запросы по ключевым словам (Иисус, Аллах, Будда), можно получать интересные и разнообразные карты религиозных измерений в киберпространстве. Главное, что позволяют увидеть карты киберландшафтов, - это неоднородность социокультурных, экономических и политических географий. Однородности нет даже на уровне одной страны, если делать картирование ее религиозного измерения. Так, например, в Индии хоть и преобладающее большинство мест имеют метки «индуисты», но в то же время на карте появляются места с метками «буддисты» (север Гималаев, Шри-Ланка) и «аллах» (на территории штата Кашмир).

Визуализация пользовательского контента Google Maps позволяет получать новые, более глубокие знания об уже, казалось бы, известных социальных явлениях. Карты киберландшафтов показывают, насколько сложно религиозное устройство общества, позволяют увидеть воочию разнообразие офлайновых географий религии. И то, какую информацию мы считываем с Google Maps о тех или иных местах, становится частью нашего опыта. В конечном счете этот частный опыт дополняет и формирует то, как то или иное место воспринимается миллионами людей в мире.

Ученые обращают внимание на то, что этот метод дает количественный учет числа меток по каждому слову в конкретном месте. Это эф-

459

фективный метод для определения количества контента, сопровождающего определенные идеи, термины и практики в любой точке мира. Однако требуется дополнительный качественный анализ получаемых количественных результатов, чтобы делать более серьезные заключения о природе кибергеографий в конкретных местах.

В ходе многочисленных экспериментов по картированию кибер-ландшафтов авторы получают подтверждение того, что, во-первых, кибер-географии неоднородны. Они не покрывают поверхность Земли равномерным облаком, скорее, они похожи на слоеный пирог, его слои где-то толще, где-то тоньше, а где-то вовсе отсутствуют. Отсюда еще один вывод, к которому приходят авторы: по мере того как мы все больше доверяем онлайн «веб 2.0»-картам, огромные части мира остаются на этих картах «тер-ра инкогнита». Сейчас это, например, территории Африки, Азии и Центральной Амерки. Примерно также, напоминают ученые, эти территории были «белыми пятнами» на европейских картах до XIX в. Что интересно, те немногочисленные описания Африки и Азии, которые сегодня есть на Google Maps, создаются в основном пользователями, находящимися за пределами этих территорий.

Ученые отмечают ряд факторов, влияющих на формирование неоднородности кибергеографий. Это прежде всего влияние цифрового неравенства в разных странах, а также разный уровень развитости интернет-инфраструктуры, разные политические и социоэкономические условия, разные стоимость и доступ к широкополосному Интернету. Серьезное влияние на формирование неравномерных кибергеографий имеет цензура. Она влияет не только на количество описаний, привязанных к одному месту на онлайн-карте, но и на содержание этих описаний, ту информацию, которая отображается об этом месте на Google Maps.

Кибергеографии, заключают Грэм и Зук, скорее кривые зеркала нашего реального мира, чем его прямые отражения. И только в таком виде их следует использовать для анализа реальных социальных явлений и тенденций.

Список литературы

Mayer-Schönberger V., Cukie K. Big data: a revolution that will transform how we live, work, and think. - Boston: Houghton Mifflin Harcourt, 2013. - 242 p.

460

i Надоели баннеры? Вы всегда можете отключить рекламу.