4 сентября Homo digitalis отмечает 25 лет плотного сожительства с главной поисковой системой планеты — Google.
Когда я познакомился с WWW в 1994 году, все искали информацию в каталоге Yahoo!, InfoSeek и Lycos. Следом появились каталог LookSmart и поисковик Altavista. Потом пришел HotBot. Открылась поисковая система Yandex. В 1998 году два аспиранта из Стэнфордского университета Ларри Пейдж и Сергей Брин запустили свой Google.
В 1998 году эталонной была Altavista, и никто не оспаривал ее первенство. Однако уже через год Google получил много денег от инвесторов. Потом еще раз, еще раз и еще раз. Очень, очень, очень много денег. От Sun Microsystems, от Amazon, от Kleiner Perkins, от Sequoia Capital… Google начал бурно развиваться.
Велик соблазн сказать, что именно обилие инвестиций обеспечило Google доминирование на рынке поисковых систем интернета. Но это было бы несправедливо. Google победил конкурентов, потому что его поисковый движок был лучше остальных.
Именно по этой причине в 2000 году король структурированной информации — каталог Yahoo! — отказался от движка Inktomi в пользу Google.
После Google пришло (и ушло) много замечательных поисковых систем: DuckDuckGo с акцентом на приватность и отказом от сбора информации о пользователях; Bing (Microsoft); Quant — гордость французской IT-мысли, ставящий во главу угла борьбу с "пузырем фильтров"; поисковый агрегатор Dogpile; поисковик для физиков и техногиков WolframAlpha; мечта конспирологов StartPage, которая не фиксирует даже IP- и MAC-адрес пользовательского компьютера, и еще много полезного и интересного. Но ни разу за последние десятилетия никому из конкурентов не удалось поколебать безоговорочное лидерство Google.
Сегодня Google (вернее, его зонтичная компания Alphabet Inc.) демонстрирует вполне себе респектабельные монополистские замашки по всем направлениям, куда дотягиваются руки. Лидер в цифровой картографии (Google Maps); крупнейший провайдер почтовых услуг (Google Mail) и офисных онлайн-приложений (Google Docs); третий крупнейший провайдер облачных услуг (Google Drive, после AWS и Azure); лидер в исследованиях по искусственному интеллекту (Pathways Language Model 2) и самый популярный онлайн-переводчик (Google Translate). Самая популярная мобильная операционная система (Android); самый популярный браузер (Chrome); культовые смартфоны (Nexus и Pixel); легкие рабочие станции (Chromebook); колонки с голосовым помощником (Nest); оптоволоконный оператор связи (Fiber) и много еще разного по мелочи — это все тоже Google.
Показательно, что никто не может упрекнуть Google в использовании нерыночных методов борьбы. Все всегда было честно. Google начинал маленьким, превратился в гиганта и стал лидером только потому, что так решил сам пользовательский рынок, который сказал: Google — лучший. Вряд ли у китайской Baidu или у Bing, принадлежащей компании с неиссякаемыми авуарами, было меньше ресурсов и рычагов общественного влияния, но тем не менее они никогда не могли приблизиться к Google по популярности.
Почему же Google стал гигантом? Ответ покажется парадоксальным: потому что Google — это монополия. Монополистские манеры возникли не потому, что корпорация что-то навязывает пользователям (как можно вообще что-то навязать в Интернете? Не хочешь — не пользуйся, альтернатив — море разливанное), а потому, что Google везде и всюду. Это обстоятельство позволяет Homo digitalis пользоваться услугами Google на автомате, что, в свою очередь, соответствует ключевой потребности людей делегировать базовые действия рефлексам. Чем больше получается делегировать, тем легче человеку жить. Нейропсихологи даже говорят, что иначе наши предки никогда не научились бы не то, что думать, но и просто ходить на двух ногах.
Понимаю, что сентенция "Google большой, потому что популярный, а популярный, потому что большой" мало кого удовлетворит, поэтому попробуем найти курицу, снесшую первое яйцо. Предлагаю сделать это апофатически (уже традиция!), то есть двигаясь от отрицания. Начнем с того, что не нравится в Google интеллектуальной публике, привыкшей мыслить критически.
У интеллектуалов есть две главных претензии к Google. Во-первых, пузырь фильтров, который возникает из-за персонализации поиска. Она, в свою очередь, основана на огромной информационной базе данных, собранной по каждому пользователю. Во-вторых, тотальная слежка, без которой персонализированную базу данных собрать невозможно.
Проще всего разобраться с пузырем фильтров. Бешеная популярность социальных поглаживаний (лайки в соцсетях), яростное нежелание большинства пользователей интернета вступать в словесные и идейные конфронтации, добровольная самоизоляция в "группах по интересам" и "междусобойчиках", не допускающих малейшего инакомыслия, — все однозначно свидетельствует о том, что большинство нетизенов воспринимает пузырь фильтров как манну небесную, а не покушение на информационную свободу.
Теперь о тотальной слежке.
Важно понимать, что big data — это не шпионство за каждым из нас лично, а инструмент гиперэффективного маркетинга.
Индивидуальная слежка в интернете ведется совершенно иными методами (если коротко, то через внедрение троянов в гаджеты жертвы).
У всякого государства есть широкий спектр возможностей для того, чтобы вынудить IT- и коммуникационные компании делиться данными об индивидуальных пользователях: историей произведенных поисковых запросов, геолокацией и динамикой перемещений, логом телефонных звонков, содержанием смартфона и т. п. В РФ подобное принуждение — беспрекословная и давно легализованная норма, в США — тоже норма, хотя и требующая пока еще судебного решения. Время от времени американское государство даже сталкивается с неожиданным отпором корпораций, но это скорее исключение из правил, чем пример эффективности механизмов, защищающих частные данные. После Patriot Act 2001 года никакого приоритета частных данных над "государственной безопасностью" не существует в природе.
Так вот, подавляющее большинство обитателей планеты неоднократно и красочно демонстрировало свое абсолютное равнодушие к вопросам цифровой и информационной безопасности. Особенно если предложение поделиться данными подкрепляется каким-нибудь пряником или выставочным сувениром. Из свежих примеров: массовое добровольное сканирование радужной оболочки глаз в поистине армагеддоновском гешефте от WorldCoin в обмен на 25 одноименных криптофантиков (читайте об этом в следующей статье).
Вот и получается, что вопросами цифровой безопасности озабочены сегодня разве что постапокалиптические шифропанки да журналисты.
К Google есть и еще одна претензия. Она, пожалуй, менее значительна, чем две предыдущие. Тем не менее она стала ключевой для всех, кто занимается в интернете профессиональной изыскательной работой, например, для журналистов или специалистов по OSINT (Open-source intelligence, разведка по открытым источникам). Речь идет о последовательной примитивизации Google собственного поискового синтаксиса.
Когда-то у Google были образцово-показательные возможности для поиска информации с помощью богатого языка запросов и аргументов формальной логики. В 2015 году мои студенты на курсе МИНОА (методики изыскания, накопления, обработки и анализа информации) учились составлять сложные поисковые запросы с использованием десятков булеанов, включений и исключений, стоп-слов, синонимов, поиска в заданном диапазоне и прочего.
Сегодня Google заменил возможность прямого использования сложного поискового синтаксиса на встроенный в интерфейс набор упрощенных "инструментов", которых, по задумке компании, за глаза хватает для удовлетворения потребностей массового пользователя.
Не сомневаюсь, что глубоко в недрах поисковой машины таятся закрытые коды для доступа к полноценной поисковой работе, однако документация по новому синтаксису удалена из публичного домена.
Справедливости ради нужно сказать, что не один Google поддался соблазну примитивизировать поисковую работу. Великолепный проприетарный поисковый синтаксис был и у Яндекса, и у других альтернативных и малоизвестных поисковых систем, однако все они предпочли избавиться от "лишних" возможностей для "упрощения" работы пользователя.
На исходе первого десятилетия нашего века помимо топовых поисковых систем в интернете появились альтернативные системы продвинутого поиска. Особенно выделялся проект Nigma, который позволял в процессе изыскательных работ ранжировать информацию по тематическим кластерам.
Казалось, что идея кластерного тематического поиска — это будущее поисковых систем, но куда там! Nigma — интеллектуальная метапоисковая система, разработанная совместно МГУ и Стэнфордским университетом, — благополучно сыграла в ящик и после череды закрытий, открытий и повторных закрытий магическим образом превратилась во вьетнамский веб-браузер Cốc Cốc.
Теперь — внимание! — вынимаем кролика из шляпы иллюзиониста: Google, лишившийся всех привлекательных для профессионалов козырей, интенсифицировавший пузырь фильтров и усиливший сбор персональных данных, замечательным образом сохранил доминирующую роль на рынке онлайн-поиска: 88% в январе 2015 года, 84% в июле 2023-го!
Сегодня у Google просматривается единственный конкурент на горизонте — микрософтовский Bing (9% рынка), успех которого объясняется почти исключительно использованием в поиске движка AI (и предустановкой в последних версиях Windows в качестве поискового механизма по умолчанию. — Прим. ред.). Если вспомнить, однако, что проприетарная LLM PaLM 2, запущенная Google в мае 2023 года, задействует в обучении 3,6 трлн цепочек слов, а LLM Megatron-Turing NLG (совместная разработка Microsoft и Nvidia) — только 0,34 трлн, резонно предположить, что в ближайшие месяцы Google не только наверстает упущенное, но и увеличит отрыв от ближайшего конкурента.
Что же мы получили в сухом остатке? Массовый пользователь убедительно продемонстрировал, что его не интересуют ни вопросы безопасности, ни пузыри фильтров, ни поисковый синтаксис, ни проблемы концентрации данных в корпоративно-государственных спайках. 84% пользовательских запросов не оставляют сомнений в предпочтениях публики. Чем же тогда берет Google свою паству?
Сила Google — именно в том, что умные люди, живущие на планете, вменяют ему в вину: в монополизации, стандартизации и упрощении.
Оригинальность и акцент на личную неповторимость, претензии на индивидуальный подход, потребность в избыточном функционале, озабоченность частными границами в реальной жизни и безопасностью в цифровом пространстве — это атрибуты, увы и ах, маргинальной части человечества. Может, 5%. Может, 10%. Ни при каком раскладе не больше.
Весь вектор развития человечества в эпоху "восстания масс" — процесса, запущенного в первой четверти ХХ века, — направлен не на индивидуализацию сознания, а лишь на выведение коммунальных особенностей человека на новый качественный уровень.
Коллективная память приписала Энди Уорхолу крылатую фразу про "15 минут мировой славы", якобы ожидающих в будущем каждого маленького человека. В 1960-е верилось, что вот этот маленький человек добьется, наконец, социальной справедливости, получит свои 15 минут прайм-тайма, выйдет под лучи прожектора, и вот тогда-то…
А что тогда-то? Ну как же: маленький человек смело заявит миру о своей неповторимости, об оригинальности своего голоса, мнения, позиции.
А дальше пришел Интернет и подарил каждому маленькому человеку его "15 минут мировой славы". Как распорядились этим шансом маленькие человеки? Нацарапали в разных закутках цифровой вселенной: "Здесь был Вася"! Одна незадача: вась, петь, джонов и йоханов никто не услышал.
Почему? Потому что не позволяла сама архитектура Web 1.0, построенная на разрозненных пользовательских страничках.
Затем придумали Web 2.0. Родились комьюнити по интересам в "уютненьком" формате LiveJournal, где любой мог графоманить с пользой для общества и быть услышанным. Пришел Facebook, создавший общую "доску", на которой все желающие могли написать свое сокровенное: "Здесь был имярек". Пришел Google, который объединил все обособленные страницы эпохи Web 1.0 и тем самым дал вторую жизнь непризнанным мастерам перочинного ножа.
И вот маленький человек, воодушевившись феноменом социальных сетей, ринулся царапать свои "жизненные креды" с удесятеренной энергией. Тогда-то и случилось чудо, которого не ожидали провидцы 1960-х с их иллюзией 15-минутного самовыражения. Маленький человек прекратил заниматься ерундой ("Здесь был имярек") и стал утверждать свою самость, демонстративно отказываясь от индивидуальности и подчеркивая свою принадлежность обществу.
"Я обожаю Бритни Спирс!" — вот квинтэссенция революции Web 2.0. Я ее обожаю, ты ее обожаешь, он ее обожает, миллионы нас ее обожают, миллиарды тоже ее обожают. "Я такой же, как все, и это звучит гордо" — не просто фундамент современной культуры мемов, но и магистральный канал вирусного распространения информации.
Если абстрагироваться от разочарования, постигшего апологетов "восстания масс", вынужденных сегодня созерцать крушение надежд на индивидуализацию частного сознания, можно заметить неожиданный технологический выверт сюжета. Коммунальность маленького человека, воплощенная в мем-культуре, открыла поистине безграничные возможности для манипулирования общественным сознанием.
Одно дело придать общий импульс толпе, в которой каждый скандирует: "Здесь был имярек!". Другое — заставить поверить толпу, дружно скандирующую: "Я обожаю Бритни Спирс!", что это именно она, толпа, сама такой мем придумала.
Технология создания мемов оказалась настолько простой для оператора, в распоряжении которого безграничный доступ к big data, структурированным по доминирующим трендам, что не удивлюсь, если Google до сих пор не осознает масштаб привалившего ему счастья.
Я, конечно, иронизирую. Все прекрасно Google осознал. Осознал и активно использует, ранжируя ответы в запросах пользователей таким образом, чтобы ходили и искали только то, что нужно (что считается правильным, политкорректным, безопасным, геополитически оправданным и т. п.). А чтобы не лазили, куда не нужно, и не находили, чего не следует, Google любезно припрятал полноценный поисковый синтаксис.
Что конкретно привлекает в поисковике Google массового пользователя? Рискну предположить, что это Knowledge Graph — "база знаний", которую система выводит в отдельном окне справа на странице результатов выдачи. По определению Knowledge Graph — это "инфобокс", содержащий релевантную информацию в дополнение к списку линков.
Кто же определяет, что релевантно и почему информация из инфобокса важна для пользователя? Google определяет. Google Knowledge Graph очень гордится тем, что его "база знаний" содержит почти 600 млн статей и 18 млрд фактов. При этом никакой открытой документации по подбору источников и — главное! — приоритетам их ранжирования в "базе знаний" не существует. Google говорит, что пользуется "разными источниками", например, CIA World Factbook или Wikipedia.
Что же тогда плохого в Knowledge Graph? Ведь и Книга мировых фактов ЦРУ, и Википедия — вполне себе ничего в роли источников информации…
Читайте также
Плохо, что Google периодически "забывает" указывать в своем инфобоксе источник информации. Но еще хуже, что для подавляющего числа пользователей Knowledge Graph стал синонимом самого процесса поиска.
Происходит это не потому, что информация в инфобоксе особо качественная, а потому, что львиная доля запросов принадлежит категории так называемого "обывательского поиска": чего-то где-то услышал модного, мемного и пошел гуглить. Вся эта публика никогда дальше инфобокса в поисковый сюжет не углубляется. Даже на линк Википедии не кликает. Потому что все это уже как-то сложно. И не нужно, когда есть Google Knowledge Graph, который всегда подсунет самую что ни на есть "релевантную" информацию.
25 лет моногамного сожительства не прошли даром. И неважно, что Google сегодня такой большой и обступает со всех сторон. Важно, что Google — идеальный инструмент поиска для Homo digitalis эпохи Web 2.0, потому что покрывает 90% информационных потребностей этого хомы.
Выходит, у нас не мезальянс вовсе, а идиллия "жили они душа в душу долго и счастливо". С чем спешу поздравить — и нас самих, и нашего суженого!