Третя війна браузерів тихо розгортається. Від Netscape до IE, а потім до Firefox і Chrome, боротьба браузерів завжди була концентрованим відображенням контролю над платформою та змінами технологічних парадигм. Chrome завоював панівне становище завдяки швидкості оновлень та екологічній взаємодії, а Google через "подвійний олігарх" у пошуку та браузері сформував закритий цикл входу в інформацію.
Проте ця схема починає хитатися. Поява великих мовних моделей (LLM) сприяє тому, що все більше користувачів виконують завдання на сторінці результатів пошуку без кліків, традиційна поведінка з кліками на веб-сторінки зменшується. Тим часом чутки про намір Apple замінити стандартну пошукову систему в Safari ще більше загрожують прибуткам Alphabet, викликаючи тривогу на ринку щодо "канонічного пошуку".
Браузер стикається з перетворенням ролі. Він більше не просто інструмент для відображення веб-сторінок, а є контейнером для багатьох можливостей, таких як введення даних, поведінка користувачів, конфіденційність особистості тощо. Хоча AI Agent досить потужний, для виконання складної взаємодії зі сторінкою, виклику локальних даних особи та контролю елементів веб-сторінки йому все ще необхідно покладатися на довірчі межі і функціональні пісочниці браузера. Браузер перетворюється з інтерфейсу людини на платформу системних викликів для агентів.
Справжнім можливим розривом у поточній ринковій ситуації браузерів не стане ще один "кращий Chrome", а нова структура взаємодії: не просто показ інформації, а виклик завдань. У майбутньому браузери повинні бути розроблені для AI Agent - не лише для читання, а й для написання та виконання. Проекти, такі як Browser Use, намагаються семантизувати структуру сторінок, перетворюючи візуальний інтерфейс на структурований текст, який може бути викликаний LLM, що значно знижує витрати на взаємодію.
Основні проекти вже почали тестування: Perplexity створив рідний браузер Comet, використовуючи ШІ замість традиційних результатів пошуку; Brave поєднує захист приватності та локальне виведення, покращуючи функції пошуку та блокування за допомогою LLM; а такі проекти, як Donut, зорієнтовані на нові входи для взаємодії ШІ та активів на блокчейні. Спільною ознакою цих проектів є те, що вони намагаються реконструювати вхідну частину браузера, а не прикрашати його вихідний шар.
Для підприємців можливості приховані в трикутних відносинах між введенням, структурою та агентами. Браузер, як інтерфейс для виклику світу майбутнім агентом, означає, що той, хто може надати структуровані, викликаємі, надійні "блоки можливостей", зможе стати частиною нового покоління платформ. Від SEO до AEO (оптимізація агентських движків), від трафіку на сторінках до виклику завдань, форма продукту та дизайнерське мислення перебудовуються. Третя війна браузерів відбувається в "введенні", а не в "відображенні"; вирішальним фактором більше не є те, хто привертає увагу користувача, а хто заслужив довіру агента та отримав вхід для виклику.
Історія розвитку браузерів
На початку 90-х років з'явився Netscape Navigator, який відкрив мільйонам користувачів двері у цифровий світ. Після цього Microsoft вбудувала Internet Explorer у систему Windows, підірвавши ринкову позицію Netscape.
Інженери Netscape відкрили вихідний код браузера, заклавши основу для проекту Mozilla. Firefox досягнув прориву в користувацькому досвіді, екосистемі плагінів, безпеці тощо, що стало ознакою перемоги духу з відкритим кодом.
У 2008 році компанія Google представила браузер Chrome, створений на основі відкритого проекту Chromium і движка WebKit. Chrome швидко став популярним завдяки частим оновленням і єдиному досвіду на всіх платформах, у 2011 році обійшов Firefox, а через півроку знову перевершив IE, завершивши перехід від конкурента до лідера.
У 2020-х роках глобальна частка ринку Chrome стабільно трималася на рівні приблизно 65%. Пошукова система Google та браузер Chrome становлять подвійну гегемонію, контролюючи пошуковий вхід та "перше вікно" для користувачів в інтернет.
Зі зростанням великих мовних моделей (LLM) традиційний пошук зазнає удару. У 2024 році частка ринку пошуку Google знизилася з 93% до 89%. Чутки про те, що Apple може запустити власну AI пошукову систему, ще більше похитнули прибуткову опору Alphabet, викликавши занепокоєння на ринку щодо майбутнього ери пошуку.
Від Navigator до Chrome, від відкритих ідей до комерціалізації реклами, від легких браузерів до AI-пошукових асистентів, боротьба браузерів завжди була війною технологій, платформ, контенту та контролю. Хто контролює вхід, той визначає майбутнє.
Застаріла архітектура сучасних браузерів
Традиційна архітектура браузера включає:
Вхідний пункт клієнтського інтерфейсу: завершення розшифровки TLS, вибірка QoS та географічний маршрут.
Розуміння запиту: виконати перевірку правопису, розширення синонімів та аналіз намірів.
Кандидат на повернення: використання зворотного індексу та векторного індексу для попереднього відбору.
Багаторівневе сортування: за допомогою легких ознак відфільтрувати кандидатні сторінки до приблизно 1000 статей.
Головна сортировка глибокого навчання: використання таких технологій, як RankBrain та Neural Matching для розуміння семантики запиту.
Глибока перетасовка: застосування моделі BERT для тонкого ранжування документів.
Ця архітектура в епоху ШІ та великих даних вже виглядає застарілою, потреби користувачів у взаємодії з браузерами змінюються.
Причини, чому ШІ перетворює браузери
Браузери все ще існуватимуть, оскільки вони є універсальною платформою, що використовується не тільки для читання даних, а й як загальний вхід для введення даних. Світ потребує генерації даних та взаємодії з веб-сайтами, тому браузери, які інтегрують персоналізовану інформацію користувачів, все ще будуть широко використовуватися.
Браузер є місцем зберігання персоналізованого контенту:
Більшість великих моделей розміщені в хмарі, що ускладнює прямий доступ до чутливих даних на локальному комп'ютері.
Усі дані, які надсилаються сторонній моделі, потребують повторного отримання дозволу користувача.
Автоматичне заповнення коду підтвердження, виклик камери та інші дії повинні виконуватися в пісочниці браузера.
Дані контексту сильно залежать від браузера, включаючи вкладки, Cookie, кеш тощо.
Глибока зміна форм взаємодії
Використання браузера можна розділити на читання даних, введення даних та взаємодію з даними. LLM змінив ефективність і спосіб читання даних, адже раніше пошук на основі ключових слів виглядав застарілим і неефективним.
Дослідження показують, що майже 63% запитів до Google є "нульовими кліками". Користувачі звикли отримувати інформацію безпосередньо зі сторінки результатів пошуку. Однак 44% опитаних вважають, що звичайні природні результати більш надійні, ніж відібрані резюме.
AI браузер повинен дослідити відповідні форми взаємодії, особливо в аспекті зчитування даних, оскільки проблема "ілюзій" поточних великих моделей все ще не вирішена.
Справжнім каталізатором революції браузерів є рівень взаємодії даних. Користувачі все більше схиляються до використання природної мови для опису складних завдань, які вже беруть на себе AI-агенти.
Майбутні браузери повинні бути спроектовані для повної автоматизації, враховуючи:
Як збалансувати досвід читання людини та зрозумілість для AI-агента
Як обслуговувати користувачів та агентські моделі на одній сторінці
Використання браузера
Browser Use побудував справжній семантичний рівень для створення семантичної архітектури розпізнавання для наступного покоління браузерів. Він переведе традиційний DOM в "семантичний DOM", що дозволяє агентам точно працювати без необхідності "переглядати координати точки перегляду".
Основні характеристики:
Абстрагувати інтерактивні елементи в JSON-фрагменти з метаданими
Перекласти всю сторінку в спрощений "список семантичних вузлів"
Отримуйте високорівневі команди з виходу LLM та відтворюйте їх у справжньому браузері
Якщо цей стандарт буде впроваджено в W3C, це суттєво вирішить проблеми введення в браузерах.
ДУГА
Компанія Browser повідомила, що браузер ARC перейде на звичайне обслуговування, а команда зосередиться на браузері DIA, орієнтованому на ШІ. Вони прогнозують, що веб-сторінки більше не будуть основним інтерфейсом взаємодії, але це судження недооцінює роль браузера.
Великі моделі відзначаються відмінними здібностями до захоплення намірів, але їхня здатність до обробки інформаційної щільності є недостатньою. Спеціалізовані веб-сторінки все ще мають переваги у складних інтерактивних сценаріях. Команда ARC не змогла розрізнити виміри вводу та виводу взаємодії, ігноруючи центральну роль браузера у представленні інформації та персоналізованому досвіді.
Справжня революція для Chrome повинна кардинально переосмислити режим рендерингу браузера, щоб відповідати вимогам взаємодії під керівництвом AI Agent, особливо в дизайні архітектури вводу.
Переплетеність
Perplexity - це AI пошукова система, з останньою оцінкою 14 мільярдів доларів. Щомісячно обробляє понад 400 мільйонів запитів і має понад 30 мільйонів активних користувачів на місяць.
Вони будують рідний браузер Comet, плануючи глибоко інтегрувати двигун відповідей Perplexity. Але ще потрібно вирішити проблему високих витрат на пошук і низької рентабельності.
Google також проводить перетворення штучного інтелекту, запускаючи новий досвід вкладки браузера "Project Mariner". Лише за рахунок функціонального наслідування важко скласти конкуренцію Google, справжній прорив вимагає перебудови архітектури браузера з нуля.
Хоробрий
Brave є досить успішним крипто-браузером, заснованим на архітектурі Chromium. Кількість активних користувачів на місяць досягає 82,7 мільйона, частка ринку становить приблизно 1%-1,5%.
Brave планує оновлення до браузера з пріоритетом на конфіденційність, але обмежений отриманням даних користувачів, рівень налаштування великої моделі є низьким. Його AI помічник Leo більше схожий на плагін, наразі немає чіткої стратегії переходу до AI Agent.
Пончик
Donut є стартапом Agentic Browser у криптоіндустрії, який отримав 7 мільйонів доларів фінансування. Мета полягає в досягненні інтегрованих можливостей "дослідження - прийняття рішень - крипто-оригінальне виконання".
Основна суть полягає в поєднанні автоматизованих шляхів виконання, які є рідними для криптографії. У майбутньому Агенти можуть замінити пошукові системи як основні точки входу трафіку, а підприємці будуть змагатися за доступ і конверсійний трафік, який приносить виконання Агентів.
Поради для підприємців
Браузер все ще є найбільшим незмінним "загальним входом" у світі Інтернету. Справжній прорив полягає в "вхідному боці" - як змусити AI Agent активно викликати продукти для виконання завдань.
Підприємці повинні розглядати проектування продукту з трьох вимірів:
Стандартизація структури інтерфейсу: чи є продукт "викликаним"? Чи підтримує він семантичну структуру DOM або JSON-мапування?
Ідентичність та доступ: Чи може Агент "перейти через бар'єри довіри"? Особливо в сценах Web3, потрібні єдині можливості для ідентифікації та підпису.
Подальше розуміння механізму трафіку: від SEO до AEO/ATF, продукт повинен мати чітку грануляцію завдань, адаптуючи синтаксис виклику під різні LLM фреймворки.
Майбутні стартапи повинні забезпечити існуючі браузери для обслуговування агентів, створюючи міст для нового покоління "потоків команд". Необхідно розробити "синтаксис інтерфейсу" для викликів агентів у світі, стати ланкою у ланцюгу довіри інтелектуальних систем, збудувати "API-фортецю" наступної моделі пошуку.
У епоху Web3 + AI Agent ключовим є залучення намірів виконання агента через виклик мережі, а не лише залучення уваги користувачів за допомогою інтерфейсу.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
AI браузер: нове поле битви та можливості третьої війни браузерів
AI браузер: поле битви третьої війни браузерів
Третя війна браузерів тихо розгортається. Від Netscape до IE, а потім до Firefox і Chrome, боротьба браузерів завжди була концентрованим відображенням контролю над платформою та змінами технологічних парадигм. Chrome завоював панівне становище завдяки швидкості оновлень та екологічній взаємодії, а Google через "подвійний олігарх" у пошуку та браузері сформував закритий цикл входу в інформацію.
Проте ця схема починає хитатися. Поява великих мовних моделей (LLM) сприяє тому, що все більше користувачів виконують завдання на сторінці результатів пошуку без кліків, традиційна поведінка з кліками на веб-сторінки зменшується. Тим часом чутки про намір Apple замінити стандартну пошукову систему в Safari ще більше загрожують прибуткам Alphabet, викликаючи тривогу на ринку щодо "канонічного пошуку".
Браузер стикається з перетворенням ролі. Він більше не просто інструмент для відображення веб-сторінок, а є контейнером для багатьох можливостей, таких як введення даних, поведінка користувачів, конфіденційність особистості тощо. Хоча AI Agent досить потужний, для виконання складної взаємодії зі сторінкою, виклику локальних даних особи та контролю елементів веб-сторінки йому все ще необхідно покладатися на довірчі межі і функціональні пісочниці браузера. Браузер перетворюється з інтерфейсу людини на платформу системних викликів для агентів.
Справжнім можливим розривом у поточній ринковій ситуації браузерів не стане ще один "кращий Chrome", а нова структура взаємодії: не просто показ інформації, а виклик завдань. У майбутньому браузери повинні бути розроблені для AI Agent - не лише для читання, а й для написання та виконання. Проекти, такі як Browser Use, намагаються семантизувати структуру сторінок, перетворюючи візуальний інтерфейс на структурований текст, який може бути викликаний LLM, що значно знижує витрати на взаємодію.
Основні проекти вже почали тестування: Perplexity створив рідний браузер Comet, використовуючи ШІ замість традиційних результатів пошуку; Brave поєднує захист приватності та локальне виведення, покращуючи функції пошуку та блокування за допомогою LLM; а такі проекти, як Donut, зорієнтовані на нові входи для взаємодії ШІ та активів на блокчейні. Спільною ознакою цих проектів є те, що вони намагаються реконструювати вхідну частину браузера, а не прикрашати його вихідний шар.
Для підприємців можливості приховані в трикутних відносинах між введенням, структурою та агентами. Браузер, як інтерфейс для виклику світу майбутнім агентом, означає, що той, хто може надати структуровані, викликаємі, надійні "блоки можливостей", зможе стати частиною нового покоління платформ. Від SEO до AEO (оптимізація агентських движків), від трафіку на сторінках до виклику завдань, форма продукту та дизайнерське мислення перебудовуються. Третя війна браузерів відбувається в "введенні", а не в "відображенні"; вирішальним фактором більше не є те, хто привертає увагу користувача, а хто заслужив довіру агента та отримав вхід для виклику.
Історія розвитку браузерів
На початку 90-х років з'явився Netscape Navigator, який відкрив мільйонам користувачів двері у цифровий світ. Після цього Microsoft вбудувала Internet Explorer у систему Windows, підірвавши ринкову позицію Netscape.
Інженери Netscape відкрили вихідний код браузера, заклавши основу для проекту Mozilla. Firefox досягнув прориву в користувацькому досвіді, екосистемі плагінів, безпеці тощо, що стало ознакою перемоги духу з відкритим кодом.
У 2008 році компанія Google представила браузер Chrome, створений на основі відкритого проекту Chromium і движка WebKit. Chrome швидко став популярним завдяки частим оновленням і єдиному досвіду на всіх платформах, у 2011 році обійшов Firefox, а через півроку знову перевершив IE, завершивши перехід від конкурента до лідера.
У 2020-х роках глобальна частка ринку Chrome стабільно трималася на рівні приблизно 65%. Пошукова система Google та браузер Chrome становлять подвійну гегемонію, контролюючи пошуковий вхід та "перше вікно" для користувачів в інтернет.
Зі зростанням великих мовних моделей (LLM) традиційний пошук зазнає удару. У 2024 році частка ринку пошуку Google знизилася з 93% до 89%. Чутки про те, що Apple може запустити власну AI пошукову систему, ще більше похитнули прибуткову опору Alphabet, викликавши занепокоєння на ринку щодо майбутнього ери пошуку.
Від Navigator до Chrome, від відкритих ідей до комерціалізації реклами, від легких браузерів до AI-пошукових асистентів, боротьба браузерів завжди була війною технологій, платформ, контенту та контролю. Хто контролює вхід, той визначає майбутнє.
Застаріла архітектура сучасних браузерів
Традиційна архітектура браузера включає:
Вхідний пункт клієнтського інтерфейсу: завершення розшифровки TLS, вибірка QoS та географічний маршрут.
Розуміння запиту: виконати перевірку правопису, розширення синонімів та аналіз намірів.
Кандидат на повернення: використання зворотного індексу та векторного індексу для попереднього відбору.
Багаторівневе сортування: за допомогою легких ознак відфільтрувати кандидатні сторінки до приблизно 1000 статей.
Головна сортировка глибокого навчання: використання таких технологій, як RankBrain та Neural Matching для розуміння семантики запиту.
Глибока перетасовка: застосування моделі BERT для тонкого ранжування документів.
Ця архітектура в епоху ШІ та великих даних вже виглядає застарілою, потреби користувачів у взаємодії з браузерами змінюються.
Причини, чому ШІ перетворює браузери
Браузери все ще існуватимуть, оскільки вони є універсальною платформою, що використовується не тільки для читання даних, а й як загальний вхід для введення даних. Світ потребує генерації даних та взаємодії з веб-сайтами, тому браузери, які інтегрують персоналізовану інформацію користувачів, все ще будуть широко використовуватися.
Браузер є місцем зберігання персоналізованого контенту:
Глибока зміна форм взаємодії
Використання браузера можна розділити на читання даних, введення даних та взаємодію з даними. LLM змінив ефективність і спосіб читання даних, адже раніше пошук на основі ключових слів виглядав застарілим і неефективним.
Дослідження показують, що майже 63% запитів до Google є "нульовими кліками". Користувачі звикли отримувати інформацію безпосередньо зі сторінки результатів пошуку. Однак 44% опитаних вважають, що звичайні природні результати більш надійні, ніж відібрані резюме.
AI браузер повинен дослідити відповідні форми взаємодії, особливо в аспекті зчитування даних, оскільки проблема "ілюзій" поточних великих моделей все ще не вирішена.
Справжнім каталізатором революції браузерів є рівень взаємодії даних. Користувачі все більше схиляються до використання природної мови для опису складних завдань, які вже беруть на себе AI-агенти.
Майбутні браузери повинні бути спроектовані для повної автоматизації, враховуючи:
Використання браузера
Browser Use побудував справжній семантичний рівень для створення семантичної архітектури розпізнавання для наступного покоління браузерів. Він переведе традиційний DOM в "семантичний DOM", що дозволяє агентам точно працювати без необхідності "переглядати координати точки перегляду".
Основні характеристики:
Якщо цей стандарт буде впроваджено в W3C, це суттєво вирішить проблеми введення в браузерах.
ДУГА
Компанія Browser повідомила, що браузер ARC перейде на звичайне обслуговування, а команда зосередиться на браузері DIA, орієнтованому на ШІ. Вони прогнозують, що веб-сторінки більше не будуть основним інтерфейсом взаємодії, але це судження недооцінює роль браузера.
Великі моделі відзначаються відмінними здібностями до захоплення намірів, але їхня здатність до обробки інформаційної щільності є недостатньою. Спеціалізовані веб-сторінки все ще мають переваги у складних інтерактивних сценаріях. Команда ARC не змогла розрізнити виміри вводу та виводу взаємодії, ігноруючи центральну роль браузера у представленні інформації та персоналізованому досвіді.
Справжня революція для Chrome повинна кардинально переосмислити режим рендерингу браузера, щоб відповідати вимогам взаємодії під керівництвом AI Agent, особливо в дизайні архітектури вводу.
Переплетеність
Perplexity - це AI пошукова система, з останньою оцінкою 14 мільярдів доларів. Щомісячно обробляє понад 400 мільйонів запитів і має понад 30 мільйонів активних користувачів на місяць.
Вони будують рідний браузер Comet, плануючи глибоко інтегрувати двигун відповідей Perplexity. Але ще потрібно вирішити проблему високих витрат на пошук і низької рентабельності.
Google також проводить перетворення штучного інтелекту, запускаючи новий досвід вкладки браузера "Project Mariner". Лише за рахунок функціонального наслідування важко скласти конкуренцію Google, справжній прорив вимагає перебудови архітектури браузера з нуля.
Хоробрий
Brave є досить успішним крипто-браузером, заснованим на архітектурі Chromium. Кількість активних користувачів на місяць досягає 82,7 мільйона, частка ринку становить приблизно 1%-1,5%.
Brave планує оновлення до браузера з пріоритетом на конфіденційність, але обмежений отриманням даних користувачів, рівень налаштування великої моделі є низьким. Його AI помічник Leo більше схожий на плагін, наразі немає чіткої стратегії переходу до AI Agent.
Пончик
Donut є стартапом Agentic Browser у криптоіндустрії, який отримав 7 мільйонів доларів фінансування. Мета полягає в досягненні інтегрованих можливостей "дослідження - прийняття рішень - крипто-оригінальне виконання".
Основна суть полягає в поєднанні автоматизованих шляхів виконання, які є рідними для криптографії. У майбутньому Агенти можуть замінити пошукові системи як основні точки входу трафіку, а підприємці будуть змагатися за доступ і конверсійний трафік, який приносить виконання Агентів.
Поради для підприємців
Браузер все ще є найбільшим незмінним "загальним входом" у світі Інтернету. Справжній прорив полягає в "вхідному боці" - як змусити AI Agent активно викликати продукти для виконання завдань.
Підприємці повинні розглядати проектування продукту з трьох вимірів:
Стандартизація структури інтерфейсу: чи є продукт "викликаним"? Чи підтримує він семантичну структуру DOM або JSON-мапування?
Ідентичність та доступ: Чи може Агент "перейти через бар'єри довіри"? Особливо в сценах Web3, потрібні єдині можливості для ідентифікації та підпису.
Подальше розуміння механізму трафіку: від SEO до AEO/ATF, продукт повинен мати чітку грануляцію завдань, адаптуючи синтаксис виклику під різні LLM фреймворки.
Майбутні стартапи повинні забезпечити існуючі браузери для обслуговування агентів, створюючи міст для нового покоління "потоків команд". Необхідно розробити "синтаксис інтерфейсу" для викликів агентів у світі, стати ланкою у ланцюгу довіри інтелектуальних систем, збудувати "API-фортецю" наступної моделі пошуку.
У епоху Web3 + AI Agent ключовим є залучення намірів виконання агента через виклик мережі, а не лише залучення уваги користувачів за допомогою інтерфейсу.