Третья война браузеров тихо разворачивается. От Netscape до IE, затем до Firefox и Chrome, борьба браузеров всегда была концентрированным отражением контроля над платформами и изменений технологических парадигм. Chrome завоевал доминирующее положение благодаря скорости обновления и экосистемной взаимосвязи, а Google создал замкнутый цикл входа в информацию через структуру "двойного олигарха" с поиском и браузером.
Однако эта структура начинает колебаться. Появление крупных языковых моделей (LLM) приводит к тому, что все больше пользователей выполняют задачи на странице результатов поиска без кликов, что снижает традиционное поведение кликов по веб-страницам. В то же время слухи о том, что Apple намеревается заменить поисковую систему по умолчанию в Safari, еще больше угрожают прибыли Alphabet, вызывая беспокойство на рынке по поводу "ортодоксальности поиска".
Браузер сталкивается с переосмыслением своей роли. Он больше не просто инструмент для отображения веб-страниц, а представляет собой контейнер, объединяющий множество возможностей, таких как ввод данных, поведение пользователей, конфиденциальность и идентичность. Хотя AI Agent силен, для выполнения сложных взаимодействий на страницах, вызова локальных данных идентичности и управления элементами веб-страницы, все равно требуется опираться на доверительную границу и функциональный песочницу браузера. Браузер превращается из человеческого интерфейса в платформу системных вызовов для агентов.
Настоящим прорывом на текущем рынке браузеров станет не другой "лучший Chrome", а новая структура взаимодействия: не отображение информации, а вызов задач. Будущие браузеры должны быть разработаны для AI Agent - они должны не только читать, но и писать и выполнять. Проекты, такие как Browser Use, пытаются семантизировать структуру страниц, превращая визуальный интерфейс в структурированный текст, который может быть вызван LLM, тем самым значительно снижая затраты на взаимодействие.
Основные проекты начали экспериментировать: Perplexity создает нативный браузер Comet, заменяя традиционные результаты поиска на ИИ; Brave объединяет защиту конфиденциальности и локальную интерпретацию, усиливая функции поиска и блокировки с помощью LLM; а такие крипто-родные проекты, как Donut, нацелены на новый вход в взаимодействие ИИ и цепочечных активов. Общая черта этих проектов: они пытаются реконструировать входную часть браузера, а не улучшать его выходной слой.
Для предпринимателей возможности скрыты в треугольных отношениях ввода, структуры и агента. Браузер, как интерфейс для вызова мира будущими агентами, означает, что тот, кто может предоставить структурированные, вызываемые и надежные "блоки возможностей", тот сможет стать частью нового поколения платформ. От SEO до AEO (Оптимизация Двигателя Агента), от трафика страниц до вызова цепочек задач, форма и дизайн продукта находятся в процессе реконструкции. Третья война браузеров происходит в "вводе", а не в "демонстрации"; победу решает не тот, кто привлекает внимание пользователя, а тот, кто завоевывает доверие агента и получает доступ к вызовам.
История развития браузеров
В начале 90-х годов браузер Netscape Navigator произвел фурор, открыв миллионам пользователей двери в цифровой мир. Затем Microsoft интегрировала Internet Explorer в операционную систему Windows, подорвав рыночные позиции Netscape.
Инженеры Netscape открыли исходный код браузера, положив начало проекту Mozilla. Firefox достиг прорыва в таких областях, как пользовательский опыт, экосистема плагинов и безопасность, что стало символом победы духа открытого кода.
В 2008 году Google выпустила браузер Chrome, созданный на основе проекта с открытым исходным кодом Chromium и движка WebKit. Благодаря частым обновлениям и единому опыту на всех платформах, Chrome быстро поднялся, в 2011 году обогнав Firefox, а через полгода снова обогнав IE, завершив путь от претендента к владыке.
В 2020-х годах глобальная доля рынка Chrome стабилизировалась на уровне около 65%. Поисковая система Google и браузер Chrome образуют двойную систему господства, контролируя вход в поиск и "первое окно" для пользователей в сеть.
С ростом крупных языковых моделей (LLM) традиционный поиск испытывает давление. В 2024 году доля рынка поиска Google упала с 93% до 89%. Слухи о том, что Apple может запустить собственную ИИ поисковую систему, еще больше потрясли прибыльный столп Alphabet, вызвав беспокойство на рынке о будущем эпохи поиска.
От Navigator до Chrome, от идеалов открытого кода до коммерциализации рекламы, от легковесных браузеров до AI-помощников поиска, борьба браузеров всегда была войной за технологии, платформы, контент и контроль. Кто контролирует вход, тот определяет будущее.
Устаревшая архитектура современных браузеров
Традиционная архитектура браузеров включает в себя:
Вход на фронтенд клиента: завершение TLS-расшифровки, выборка QoS и географическая маршрутизация.
Понимание запроса: выполнение проверки орфографии, расширение синонимов и анализ намерений.
Кандидат на возврат: предварительный отбор с использованием обратных индексов и векторных индексов.
Многоуровневая сортировка: отбор候选 страниц до примерно 1000 статей с помощью легких характеристик.
Глубокое обучение главного ранжирования: использование таких технологий, как RankBrain и Neural Matching для понимания семантики запросов.
Глубокая переработка: применение модели BERT для тонкой сортировки документов.
Эта архитектура устарела в эпоху ИИ и больших данных, и потребности пользователей в взаимодействии с браузером меняются.
Причины, по которым ИИ меняет браузеры
Браузеры все еще будут существовать, потому что они являются универсальной платформой, используемой не только для чтения данных, но и как универсальный вход для ввода данных. Миру необходимо генерировать данные и взаимодействовать с веб-сайтами, а браузеры, которые интегрируют персонализированную информацию пользователей, по-прежнему будут широко востребованы.
Браузер является местом хранения персонализированного контента:
Большинство крупных моделей размещены в облаке, и их трудно напрямую использовать с локальными конфиденциальными данными.
Для передачи всех данных третьей стороне необходимо повторно получить разрешение пользователя.
Автоматическое заполнение кода проверки, вызов камеры и другие действия должны выполняться в песочнице браузера.
Данные контекста сильно зависят от браузера, включая вкладки, куки, кэш и т.д.
Глубокие изменения в формах взаимодействия
Поведение браузера можно разделить на чтение данных, ввод данных и интерактивные данные. LLM изменил эффективность и способ чтения данных, в прошлом основанный на поиске по ключевым словам, казался устаревшим и неэффективным.
Исследования показывают, что почти 63% запросов в Google относятся к "нулевым кликам". Пользователи привыкли получать информацию прямо с страницы результатов поиска. Тем не менее, 44% респондентов считают, что обычные органические результаты более надежны, чем избранные аннотации.
AI браузер должен исследовать адекватные формы взаимодействия, особенно в области чтения данных, поскольку текущая "галлюцинация" больших моделей еще не устранена.
Действительно, триггером революции браузеров является уровень взаимодействия данных. Пользователи все больше предпочитают использовать естественный язык для описания сложных задач, которые теперь берут на себя AI-агенты.
Будущие браузеры должны быть спроектированы для полной автоматизации, учитывая:
Как совместить опыт чтения человеком и распознаваемость AI-агентом
Как обслуживать пользователей и модели агентов на одной странице
Использование браузера
Browser Use создала настоящий семантический уровень, чтобы построить архитектуру семантического распознавания для следующего поколения браузеров. Он повторно декодирует традиционный DOM в "семантический DOM", позволяя агентам точно взаимодействовать без необходимости "смотреть координаты точки просмотра".
Основные характеристики:
Абстрагировать интерактивные элементы в JSON-фрагменты с сопутствующими метаданными
Преобразовать всю страницу в плоский "список семантических узлов"
Получение высокоуровневых команд от LLM и воспроизведение их в реальном браузере
Как только этот стандарт будет принят W3C, это значительно решит проблемы ввода в браузерах.
ДУГА
Компания Browser заявила, что браузер ARC перейдет на регулярное обслуживание, а команда сосредоточится на браузере DIA, ориентированном на ИИ. Они предсказывают, что веб-страницы больше не будут основным интерфейсом взаимодействия, однако это суждение недооценивало роль браузера.
Большие модели отлично справляются с захватом намерений, но обладают недостаточной способностью к хранению информационной плотности. Специальные веб-страницы по-прежнему имеют преимущества в сложных сценариях взаимодействия. Команда ARC не смогла различить входные и выходные параметры взаимодействия, игнорируя центральную роль браузера в представлении информации и персонализированном опыте.
Для того чтобы по-настоящему потрясти Chrome, необходимо радикально переработать режим рендеринга браузера, адаптируя его к требованиям взаимодействия под руководством AI Agent, особенно в дизайне архитектуры ввода.
Путаница
Perplexity — это AI поисковая система, с последней оценкой 14 миллиардов долларов. Она обрабатывает более 400 миллионов поисковых запросов в месяц и имеет более 30 миллионов активных пользователей.
Он разрабатывает нативный браузер Comet, который планирует глубоко интегрировать движок ответов Perplexity. Однако необходимо решить проблемы с высокими затратами на поиск и низкой рентабельностью.
Google также проводит преобразование с помощью ИИ, выпуская новый опыт вкладок браузера "Project Mariner". Простого копирования функционала недостаточно, чтобы составить угрозу Google; для настоящего прорыва необходимо перестроить архитектуру браузера с нуля.
Храбрый
Brave является довольно успешным крипто-браузером, основанным на архитектуре Chromium. Ежемесячная активная аудитория достигает 82,7 миллиона, а доля рынка составляет примерно 1%-1,5%.
Brave планирует перейти на приоритетный режим конфиденциальности в AI браузере, но ограничен получением пользовательских данных, степень настройки больших моделей довольно низка. Его AI помощник Leo больше похож на внешний плагин, у него пока нет четкой стратегии полного перехода на AI Agent.
Пончик
Donut — это стартап в области Crypto, являющийся Agentic Browser, который получил финансирование в размере 7 миллионов долларов. Цель состоит в том, чтобы реализовать интегрированную способность "исследование-решение-крипто-нативное выполнение".
Суть заключается в сочетании автоматизированного пути выполнения, основанного на криптографии. В будущем агенты могут заменить поисковые системы в качестве основного источника трафика, и предприниматели будут бороться за доступ и конверсионный трафик, который обеспечивают агенты.
Советы для предпринимателей
Браузер по-прежнему остается самым большим "главным входом" в интернет-мир, который не был реконструирован. Истинная точка прорыва заключается в "стороне ввода" - как заставить AI-агента активно вызывать продукты для выполнения задач.
Предприниматели должны рассматривать дизайн продукта с трех измерений:
Стандартизация структуры интерфейса: является ли продукт "вызываемым"? Поддерживает ли он семантическую структуру DOM или JSON-маппинг?
Идентификация и доступ: Может ли Agent "перепрыгнуть через барьеры доверия"? Особенно в сценариях Web3 необходимо единое удостоверение личности и возможности подписи.
Понимание механизма трафика: от SEO до AEO/ATF, продукт должен иметь четкую гранулярность задач, адаптированную к синтаксису вызова разных LLM фреймов.
Будущие предпринимательские проекты должны заставить существующие браузеры служить агентам и построить мост для нового поколения "потока команд". Необходимо разработать "синтаксис интерфейса" для вызова агентом, стать звеном в цепочке доверия интеллектуальных агентов и построить "API-замок" для следующей модели поиска.
В эпоху Web3 + AI Agent ключевым моментом является захват намерения выполнения агента через вызов цепи, а не просто привлечение внимания пользователей с помощью пользовательского интерфейса.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
AI-браузер: новое поле битвы и возможности третьей войны браузеров
ИИ Браузер: Поле битвы третьей войны браузеров
Третья война браузеров тихо разворачивается. От Netscape до IE, затем до Firefox и Chrome, борьба браузеров всегда была концентрированным отражением контроля над платформами и изменений технологических парадигм. Chrome завоевал доминирующее положение благодаря скорости обновления и экосистемной взаимосвязи, а Google создал замкнутый цикл входа в информацию через структуру "двойного олигарха" с поиском и браузером.
Однако эта структура начинает колебаться. Появление крупных языковых моделей (LLM) приводит к тому, что все больше пользователей выполняют задачи на странице результатов поиска без кликов, что снижает традиционное поведение кликов по веб-страницам. В то же время слухи о том, что Apple намеревается заменить поисковую систему по умолчанию в Safari, еще больше угрожают прибыли Alphabet, вызывая беспокойство на рынке по поводу "ортодоксальности поиска".
Браузер сталкивается с переосмыслением своей роли. Он больше не просто инструмент для отображения веб-страниц, а представляет собой контейнер, объединяющий множество возможностей, таких как ввод данных, поведение пользователей, конфиденциальность и идентичность. Хотя AI Agent силен, для выполнения сложных взаимодействий на страницах, вызова локальных данных идентичности и управления элементами веб-страницы, все равно требуется опираться на доверительную границу и функциональный песочницу браузера. Браузер превращается из человеческого интерфейса в платформу системных вызовов для агентов.
Настоящим прорывом на текущем рынке браузеров станет не другой "лучший Chrome", а новая структура взаимодействия: не отображение информации, а вызов задач. Будущие браузеры должны быть разработаны для AI Agent - они должны не только читать, но и писать и выполнять. Проекты, такие как Browser Use, пытаются семантизировать структуру страниц, превращая визуальный интерфейс в структурированный текст, который может быть вызван LLM, тем самым значительно снижая затраты на взаимодействие.
Основные проекты начали экспериментировать: Perplexity создает нативный браузер Comet, заменяя традиционные результаты поиска на ИИ; Brave объединяет защиту конфиденциальности и локальную интерпретацию, усиливая функции поиска и блокировки с помощью LLM; а такие крипто-родные проекты, как Donut, нацелены на новый вход в взаимодействие ИИ и цепочечных активов. Общая черта этих проектов: они пытаются реконструировать входную часть браузера, а не улучшать его выходной слой.
Для предпринимателей возможности скрыты в треугольных отношениях ввода, структуры и агента. Браузер, как интерфейс для вызова мира будущими агентами, означает, что тот, кто может предоставить структурированные, вызываемые и надежные "блоки возможностей", тот сможет стать частью нового поколения платформ. От SEO до AEO (Оптимизация Двигателя Агента), от трафика страниц до вызова цепочек задач, форма и дизайн продукта находятся в процессе реконструкции. Третья война браузеров происходит в "вводе", а не в "демонстрации"; победу решает не тот, кто привлекает внимание пользователя, а тот, кто завоевывает доверие агента и получает доступ к вызовам.
История развития браузеров
В начале 90-х годов браузер Netscape Navigator произвел фурор, открыв миллионам пользователей двери в цифровой мир. Затем Microsoft интегрировала Internet Explorer в операционную систему Windows, подорвав рыночные позиции Netscape.
Инженеры Netscape открыли исходный код браузера, положив начало проекту Mozilla. Firefox достиг прорыва в таких областях, как пользовательский опыт, экосистема плагинов и безопасность, что стало символом победы духа открытого кода.
В 2008 году Google выпустила браузер Chrome, созданный на основе проекта с открытым исходным кодом Chromium и движка WebKit. Благодаря частым обновлениям и единому опыту на всех платформах, Chrome быстро поднялся, в 2011 году обогнав Firefox, а через полгода снова обогнав IE, завершив путь от претендента к владыке.
В 2020-х годах глобальная доля рынка Chrome стабилизировалась на уровне около 65%. Поисковая система Google и браузер Chrome образуют двойную систему господства, контролируя вход в поиск и "первое окно" для пользователей в сеть.
С ростом крупных языковых моделей (LLM) традиционный поиск испытывает давление. В 2024 году доля рынка поиска Google упала с 93% до 89%. Слухи о том, что Apple может запустить собственную ИИ поисковую систему, еще больше потрясли прибыльный столп Alphabet, вызвав беспокойство на рынке о будущем эпохи поиска.
От Navigator до Chrome, от идеалов открытого кода до коммерциализации рекламы, от легковесных браузеров до AI-помощников поиска, борьба браузеров всегда была войной за технологии, платформы, контент и контроль. Кто контролирует вход, тот определяет будущее.
Устаревшая архитектура современных браузеров
Традиционная архитектура браузеров включает в себя:
Вход на фронтенд клиента: завершение TLS-расшифровки, выборка QoS и географическая маршрутизация.
Понимание запроса: выполнение проверки орфографии, расширение синонимов и анализ намерений.
Кандидат на возврат: предварительный отбор с использованием обратных индексов и векторных индексов.
Многоуровневая сортировка: отбор候选 страниц до примерно 1000 статей с помощью легких характеристик.
Глубокое обучение главного ранжирования: использование таких технологий, как RankBrain и Neural Matching для понимания семантики запросов.
Глубокая переработка: применение модели BERT для тонкой сортировки документов.
Эта архитектура устарела в эпоху ИИ и больших данных, и потребности пользователей в взаимодействии с браузером меняются.
Причины, по которым ИИ меняет браузеры
Браузеры все еще будут существовать, потому что они являются универсальной платформой, используемой не только для чтения данных, но и как универсальный вход для ввода данных. Миру необходимо генерировать данные и взаимодействовать с веб-сайтами, а браузеры, которые интегрируют персонализированную информацию пользователей, по-прежнему будут широко востребованы.
Браузер является местом хранения персонализированного контента:
Глубокие изменения в формах взаимодействия
Поведение браузера можно разделить на чтение данных, ввод данных и интерактивные данные. LLM изменил эффективность и способ чтения данных, в прошлом основанный на поиске по ключевым словам, казался устаревшим и неэффективным.
Исследования показывают, что почти 63% запросов в Google относятся к "нулевым кликам". Пользователи привыкли получать информацию прямо с страницы результатов поиска. Тем не менее, 44% респондентов считают, что обычные органические результаты более надежны, чем избранные аннотации.
AI браузер должен исследовать адекватные формы взаимодействия, особенно в области чтения данных, поскольку текущая "галлюцинация" больших моделей еще не устранена.
Действительно, триггером революции браузеров является уровень взаимодействия данных. Пользователи все больше предпочитают использовать естественный язык для описания сложных задач, которые теперь берут на себя AI-агенты.
Будущие браузеры должны быть спроектированы для полной автоматизации, учитывая:
Использование браузера
Browser Use создала настоящий семантический уровень, чтобы построить архитектуру семантического распознавания для следующего поколения браузеров. Он повторно декодирует традиционный DOM в "семантический DOM", позволяя агентам точно взаимодействовать без необходимости "смотреть координаты точки просмотра".
Основные характеристики:
Как только этот стандарт будет принят W3C, это значительно решит проблемы ввода в браузерах.
ДУГА
Компания Browser заявила, что браузер ARC перейдет на регулярное обслуживание, а команда сосредоточится на браузере DIA, ориентированном на ИИ. Они предсказывают, что веб-страницы больше не будут основным интерфейсом взаимодействия, однако это суждение недооценивало роль браузера.
Большие модели отлично справляются с захватом намерений, но обладают недостаточной способностью к хранению информационной плотности. Специальные веб-страницы по-прежнему имеют преимущества в сложных сценариях взаимодействия. Команда ARC не смогла различить входные и выходные параметры взаимодействия, игнорируя центральную роль браузера в представлении информации и персонализированном опыте.
Для того чтобы по-настоящему потрясти Chrome, необходимо радикально переработать режим рендеринга браузера, адаптируя его к требованиям взаимодействия под руководством AI Agent, особенно в дизайне архитектуры ввода.
Путаница
Perplexity — это AI поисковая система, с последней оценкой 14 миллиардов долларов. Она обрабатывает более 400 миллионов поисковых запросов в месяц и имеет более 30 миллионов активных пользователей.
Он разрабатывает нативный браузер Comet, который планирует глубоко интегрировать движок ответов Perplexity. Однако необходимо решить проблемы с высокими затратами на поиск и низкой рентабельностью.
Google также проводит преобразование с помощью ИИ, выпуская новый опыт вкладок браузера "Project Mariner". Простого копирования функционала недостаточно, чтобы составить угрозу Google; для настоящего прорыва необходимо перестроить архитектуру браузера с нуля.
Храбрый
Brave является довольно успешным крипто-браузером, основанным на архитектуре Chromium. Ежемесячная активная аудитория достигает 82,7 миллиона, а доля рынка составляет примерно 1%-1,5%.
Brave планирует перейти на приоритетный режим конфиденциальности в AI браузере, но ограничен получением пользовательских данных, степень настройки больших моделей довольно низка. Его AI помощник Leo больше похож на внешний плагин, у него пока нет четкой стратегии полного перехода на AI Agent.
Пончик
Donut — это стартап в области Crypto, являющийся Agentic Browser, который получил финансирование в размере 7 миллионов долларов. Цель состоит в том, чтобы реализовать интегрированную способность "исследование-решение-крипто-нативное выполнение".
Суть заключается в сочетании автоматизированного пути выполнения, основанного на криптографии. В будущем агенты могут заменить поисковые системы в качестве основного источника трафика, и предприниматели будут бороться за доступ и конверсионный трафик, который обеспечивают агенты.
Советы для предпринимателей
Браузер по-прежнему остается самым большим "главным входом" в интернет-мир, который не был реконструирован. Истинная точка прорыва заключается в "стороне ввода" - как заставить AI-агента активно вызывать продукты для выполнения задач.
Предприниматели должны рассматривать дизайн продукта с трех измерений:
Стандартизация структуры интерфейса: является ли продукт "вызываемым"? Поддерживает ли он семантическую структуру DOM или JSON-маппинг?
Идентификация и доступ: Может ли Agent "перепрыгнуть через барьеры доверия"? Особенно в сценариях Web3 необходимо единое удостоверение личности и возможности подписи.
Понимание механизма трафика: от SEO до AEO/ATF, продукт должен иметь четкую гранулярность задач, адаптированную к синтаксису вызова разных LLM фреймов.
Будущие предпринимательские проекты должны заставить существующие браузеры служить агентам и построить мост для нового поколения "потока команд". Необходимо разработать "синтаксис интерфейса" для вызова агентом, стать звеном в цепочке доверия интеллектуальных агентов и построить "API-замок" для следующей модели поиска.
В эпоху Web3 + AI Agent ключевым моментом является захват намерения выполнения агента через вызов цепи, а не просто привлечение внимания пользователей с помощью пользовательского интерфейса.