Navegador de IA: O campo de batalha da terceira guerra dos navegadores
A terceira guerra dos navegadores está se desenrolando silenciosamente. Desde Netscape até IE, passando por Firefox e Chrome, a disputa entre navegadores sempre foi uma manifestação concentrada do controle da plataforma e da mudança de paradigmas tecnológicos. O Chrome conquistou a posição dominante graças à velocidade de atualização e à interconexão ecológica, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informações.
No entanto, este padrão está a abalar-se. O surgimento de modelos de linguagem de grande dimensão (LLM) está a fazer com que cada vez mais utilizadores completem tarefas na página de resultados de pesquisa com "zero cliques", reduzindo assim o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, os rumores de que a Apple pretende substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, gerando uma inquietação no mercado em relação à "ortodoxia da pesquisa".
Os navegadores estão a enfrentar uma reconfiguração de papéis. Eles não são apenas ferramentas para exibir páginas da web, mas sim contêineres que reúnem várias capacidades, como entrada de dados, comportamento do usuário e identidade de privacidade. Embora o Agente de IA seja poderoso, para realizar interações complexas em páginas, acessar dados de identidade locais e controlar elementos da web, ainda precisa contar com as fronteiras de confiança e o sandbox funcional do navegador. O navegador está a transformar-se de uma interface humana para uma plataforma de chamadas de sistema para Agentes.
O que realmente pode quebrar o atual paradigma do mercado de navegadores não é outro "Chrome melhor", mas sim uma nova estrutura de interação: não a exibição de informações, mas a chamada de tarefas. No futuro, os navegadores devem ser projetados para Agentes de IA - não apenas para ler, mas também para escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para instruções e reduzindo significativamente o custo de interação.
Projetos mainstream começaram a experimentar: Perplexity constrói o navegador nativo Comet, substituindo os resultados de busca tradicionais por IA; Brave combina proteção de privacidade com raciocínio local, utilizando LLM para melhorar a busca e as funções de bloqueio; enquanto projetos nativos de criptomoedas como Donut visam uma nova entrada para a interação entre IA e ativos na blockchain. A característica comum desses projetos é: tentar reconstruir a interface de entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface que chama o mundo no futuro, significa que quem puder fornecer "blocos de capacidade" que sejam estruturados, chamáveis e confiáveis, poderá se tornar parte integrante da nova geração de plataformas. Desde SEO até AEO (Otimização do Motor de Agentes), desde o tráfego da página até a chamada de cadeia de tarefas, a forma e o pensamento de design do produto estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que decide o vencedor não é mais quem captura a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para a chamada.
Breve história do desenvolvimento dos navegadores
No início da década de 90, o Netscape Navigator surgiu, abrindo as portas do mundo digital para milhões de usuários. A Microsoft, em seguida, integrou o Internet Explorer ao sistema Windows, desmantelando a posição de mercado da Netscape.
Os engenheiros da Netscape tornaram o código-fonte do navegador público, estabelecendo as bases para o projeto Mozilla. O Firefox fez avanços em áreas como experiência do usuário, ecossistema de plugins e segurança, marcando a vitória do espírito de código aberto.
Em 2008, o Google lançou o navegador Chrome, desenvolvido com base no projeto de código aberto Chromium e no motor WebKit. O Chrome rapidamente se destacou devido a suas atualizações frequentes e uma experiência unificada em todas as plataformas, superando o Firefox em 2011 e, seis meses depois, ultrapassando novamente o IE, completando a transformação de desafiador para dominador.
Na década de 2020, a quota de mercado global do Chrome estabilizou-se em cerca de 65%. O motor de busca Google e o navegador Chrome formam um sistema de dupla hegemonia, controlando a entrada de pesquisa e a "primeira janela" pela qual os usuários acessam a web.
Com a ascensão dos grandes modelos de linguagem (LLM), as buscas tradicionais estão sendo impactadas. Em 2024, a quota de mercado de buscas do Google caiu de 93% para 89%. Os rumores de que a Apple pode lançar seu próprio motor de busca com IA abalaram ainda mais o pilar de lucros da Alphabet, gerando incertezas no mercado sobre o futuro da era das buscas.
Da Navigator ao Chrome, da ideia do código aberto à comercialização da publicidade, da navegação leve ao assistente de pesquisa AI, a batalha dos navegadores sempre foi uma guerra sobre tecnologia, plataformas, conteúdo e controle. Quem controla a entrada, define o futuro.
A arquitetura antiga dos navegadores modernos
A arquitetura tradicional do navegador inclui:
Entrada do front-end do cliente: completa a descriptografia TLS, amostragem QoS e roteamento geográfico.
Compreensão da consulta: realizar correção ortográfica, expansão de sinônimos e análise de intenção.
Recuperação de candidatos: usar índices invertidos e índices vetoriais para a triagem inicial.
Classificação em múltiplos níveis: Filtrar as páginas candidatas para cerca de 1000 através de características leves.
Classificação principal de aprendizado profundo: usar tecnologias como RankBrain e Neural Matching para entender o significado das consultas.
Reorganização Profunda: Aplicar o modelo BERT para classificar documentos de forma detalhada.
Esta arquitetura já parece antiga na era da IA e dos grandes dados, e as necessidades de interação dos usuários com o navegador estão a mudar.
As razões pelas quais a IA está a remodelar o navegador
Os navegadores continuarão a existir, pois são plataformas universais, não apenas para ler dados, mas também como uma entrada universal para inserir dados. O mundo precisa gerar dados e interagir com sites, e os navegadores que integram informações personalizadas dos usuários ainda estarão amplamente presentes.
O navegador é um local de armazenamento de conteúdo personalizado:
A maioria dos grandes modelos está hospedada na nuvem, tornando difícil a chamada direta de dados sensíveis locais.
Para enviar todos os dados para um modelo de terceiros, é necessário obter novamente a autorização do usuário.
O preenchimento automático do código de verificação, a chamada da câmara, entre outros, devem ser realizados dentro da sandbox do navegador.
O contexto dos dados depende fortemente do navegador, incluindo abas, cookies, cache, etc.
A profunda transformação das formas de interação
O comportamento de uso do navegador pode ser dividido em leitura de dados, entrada de dados e interação de dados. O LLM mudou a eficiência e a forma de leitura de dados, sendo que a busca baseada em palavras-chave parece antiquada e ineficiente.
Estudos mostram que quase 63% das pesquisas no Google são comportamentos de "zero cliques". Os usuários costumam obter informações diretamente na página de resultados de busca. No entanto, 44% dos entrevistados acreditam que os resultados naturais regulares são mais confiáveis do que os resumos destacados.
Os navegadores de IA precisam explorar formas de interação adequadas, especialmente na leitura de dados, uma vez que o "problema da alucinação" dos modelos atuais ainda não foi resolvido.
O que realmente desencadeou a revolução do navegador foi a camada de interação de dados. Os usuários estão cada vez mais inclinados a usar linguagem natural para descrever tarefas complexas, e essas Tarefas Agenciais estão sendo assumidas por Agentes de IA.
O navegador do futuro deve ser projetado para total automação, considerando:
Como equilibrar a experiência de leitura humana com a interpretabilidade do agente de IA
Como servir usuários e modelos de agentes na mesma página
Uso do Navegador
O uso do navegador construiu uma verdadeira camada semântica, criando uma arquitetura de reconhecimento semântico para a próxima geração de navegadores. Ele redecodifica o DOM tradicional em "DOM semântico", permitindo que os agentes operem com precisão sem precisar de "coordenadas de pontos de visualização".
Principais características:
Abstract interactive elements into JSON fragments, accompanied by metadata
Traduzir toda a página para uma "lista de nós semânticos" achatada.
Receber instruções de alto nível da saída do LLM e reproduzi-las no navegador real
Uma vez que este conjunto de padrões seja introduzido no W3C, irá resolver significativamente os problemas de entrada nos navegadores.
ARC
A Browser Company afirmou que o navegador ARC entrará em manutenção regular, enquanto a equipe foca no navegador DIA voltado para IA. Eles preveem que as páginas da Web deixarão de ser a principal interface de interação, mas esse julgamento subestima o papel do navegador.
Os grandes modelos são excelentes na captura de intenções, mas têm uma capacidade insuficiente de suportar densidade de informações. Páginas web dedicadas ainda têm vantagens em cenários de interação complexos. A equipe ARC não conseguiu diferenciar as dimensões de entrada e saída da interação, ignorando o papel central do navegador na apresentação de informações e na experiência personalizada.
Para realmente desafiar o Chrome, é necessário uma reestruturação fundamental do modo de renderização do navegador, adaptando-se às necessidades de interação sob a liderança do Agente de IA, especialmente no que diz respeito ao design da arquitetura do lado de entrada.
Perplexidade
Perplexity é um motor de busca de IA, com uma avaliação recente de 14 bilhões de dólares. Processa mais de 400 milhões de consultas de busca por mês, com mais de 30 milhões de usuários ativos mensais.
Está a construir um navegador nativo chamado Comet, com planos para integrar profundamente o motor de respostas da Perplexity. No entanto, ainda é necessário resolver o problema dos altos custos de pesquisa e das baixas margens de lucro.
O Google também está a realizar uma reestruturação com IA, lançando uma nova experiência de separadores do navegador chamada "Project Mariner". Apenas imitar funcionalidades não é suficiente para representar uma ameaça ao Google; um verdadeiro avanço requer uma reestruturação da arquitetura do navegador a partir da base.
Brave
Brave é um navegador Crypto bastante bem-sucedido, baseado na arquitetura Chromium. O número de usuários ativos mensais atinge 82,7 milhões, com uma quota de mercado de cerca de 1%-1,5%.
O Brave planeia atualizar-se para um navegador de IA prioritário em privacidade, mas está limitado à obtenção de dados dos utilizadores, com um nível de personalização do modelo grande relativamente baixo. O seu assistente de IA, Leo, é mais semelhante a um plugin externo, sem uma estratégia clara de transição para um Agente de IA.
Donut
Donut é um projeto inicial de Agentic Browser na indústria Crypto, que recebeu 7 milhões de dólares em financiamento. O objetivo é alcançar a capacidade integrada de "exploração-decisão-execução nativa de criptomoedas".
O núcleo reside na combinação de caminhos de execução automatizados nativos da criptografia. No futuro, o Agente pode substituir os motores de busca como a principal entrada de tráfego, e os empreendedores irão competir pelo tráfego de acesso e conversão gerado pela execução do Agente.
Conselhos para empreendedores
O navegador continua a ser a maior "porta de entrada" não reestruturada do mundo da internet. O verdadeiro ponto de viragem reside no "lado da entrada" - como fazer com que o Agente de IA invoque proativamente produtos para completar tarefas.
Os empreendedores devem considerar o design do produto a partir de três dimensões:
Normalização da estrutura da interface: o produto é "chamável"? Suporta estrutura DOM semântica ou mapeamento JSON?
Identidade e Acesso: Será que o Agent consegue "superar as barreiras de confiança"? Especialmente no cenário Web3, é necessária uma capacidade unificada de identidade e assinatura.
Compreensão adicional do mecanismo de fluxo: de SEO para AEO/ATF, o produto deve ter uma granularidade de tarefa clara, adaptando-se à sintaxe de chamada de diferentes estruturas LLM.
Os projetos de empreendedorismo do futuro devem permitir que os navegadores existentes sirvam o Agent, criando uma ponte para a nova geração de "fluxo de comandos". É necessário construir a "sintaxe de interface" que chama o mundo do Agent, tornando-se um elo na cadeia de confiança dos agentes e construindo o "castelo de APIs" para o próximo modo de busca.
Na era do Web3 + AI Agent, a chave está em capturar a intenção de execução do Agent através da chamada da cadeia, em vez de depender apenas da interface do usuário para captar a atenção do utilizador.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Navegador de IA: O novo campo de batalha e oportunidades da terceira guerra dos navegadores
Navegador de IA: O campo de batalha da terceira guerra dos navegadores
A terceira guerra dos navegadores está se desenrolando silenciosamente. Desde Netscape até IE, passando por Firefox e Chrome, a disputa entre navegadores sempre foi uma manifestação concentrada do controle da plataforma e da mudança de paradigmas tecnológicos. O Chrome conquistou a posição dominante graças à velocidade de atualização e à interconexão ecológica, enquanto o Google, através da estrutura de "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informações.
No entanto, este padrão está a abalar-se. O surgimento de modelos de linguagem de grande dimensão (LLM) está a fazer com que cada vez mais utilizadores completem tarefas na página de resultados de pesquisa com "zero cliques", reduzindo assim o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, os rumores de que a Apple pretende substituir o motor de busca padrão no Safari ameaçam ainda mais a base de lucros da Alphabet, gerando uma inquietação no mercado em relação à "ortodoxia da pesquisa".
Os navegadores estão a enfrentar uma reconfiguração de papéis. Eles não são apenas ferramentas para exibir páginas da web, mas sim contêineres que reúnem várias capacidades, como entrada de dados, comportamento do usuário e identidade de privacidade. Embora o Agente de IA seja poderoso, para realizar interações complexas em páginas, acessar dados de identidade locais e controlar elementos da web, ainda precisa contar com as fronteiras de confiança e o sandbox funcional do navegador. O navegador está a transformar-se de uma interface humana para uma plataforma de chamadas de sistema para Agentes.
O que realmente pode quebrar o atual paradigma do mercado de navegadores não é outro "Chrome melhor", mas sim uma nova estrutura de interação: não a exibição de informações, mas a chamada de tarefas. No futuro, os navegadores devem ser projetados para Agentes de IA - não apenas para ler, mas também para escrever e executar. Projetos como Browser Use estão tentando semantizar a estrutura das páginas, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando o mapeamento de páginas para instruções e reduzindo significativamente o custo de interação.
Projetos mainstream começaram a experimentar: Perplexity constrói o navegador nativo Comet, substituindo os resultados de busca tradicionais por IA; Brave combina proteção de privacidade com raciocínio local, utilizando LLM para melhorar a busca e as funções de bloqueio; enquanto projetos nativos de criptomoedas como Donut visam uma nova entrada para a interação entre IA e ativos na blockchain. A característica comum desses projetos é: tentar reconstruir a interface de entrada do navegador, em vez de embelezar sua camada de saída.
Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agentes. O navegador, como a interface que chama o mundo no futuro, significa que quem puder fornecer "blocos de capacidade" que sejam estruturados, chamáveis e confiáveis, poderá se tornar parte integrante da nova geração de plataformas. Desde SEO até AEO (Otimização do Motor de Agentes), desde o tráfego da página até a chamada de cadeia de tarefas, a forma e o pensamento de design do produto estão sendo reestruturados. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que decide o vencedor não é mais quem captura a atenção do usuário, mas quem ganha a confiança do agente e obtém a entrada para a chamada.
Breve história do desenvolvimento dos navegadores
No início da década de 90, o Netscape Navigator surgiu, abrindo as portas do mundo digital para milhões de usuários. A Microsoft, em seguida, integrou o Internet Explorer ao sistema Windows, desmantelando a posição de mercado da Netscape.
Os engenheiros da Netscape tornaram o código-fonte do navegador público, estabelecendo as bases para o projeto Mozilla. O Firefox fez avanços em áreas como experiência do usuário, ecossistema de plugins e segurança, marcando a vitória do espírito de código aberto.
Em 2008, o Google lançou o navegador Chrome, desenvolvido com base no projeto de código aberto Chromium e no motor WebKit. O Chrome rapidamente se destacou devido a suas atualizações frequentes e uma experiência unificada em todas as plataformas, superando o Firefox em 2011 e, seis meses depois, ultrapassando novamente o IE, completando a transformação de desafiador para dominador.
Na década de 2020, a quota de mercado global do Chrome estabilizou-se em cerca de 65%. O motor de busca Google e o navegador Chrome formam um sistema de dupla hegemonia, controlando a entrada de pesquisa e a "primeira janela" pela qual os usuários acessam a web.
Com a ascensão dos grandes modelos de linguagem (LLM), as buscas tradicionais estão sendo impactadas. Em 2024, a quota de mercado de buscas do Google caiu de 93% para 89%. Os rumores de que a Apple pode lançar seu próprio motor de busca com IA abalaram ainda mais o pilar de lucros da Alphabet, gerando incertezas no mercado sobre o futuro da era das buscas.
Da Navigator ao Chrome, da ideia do código aberto à comercialização da publicidade, da navegação leve ao assistente de pesquisa AI, a batalha dos navegadores sempre foi uma guerra sobre tecnologia, plataformas, conteúdo e controle. Quem controla a entrada, define o futuro.
A arquitetura antiga dos navegadores modernos
A arquitetura tradicional do navegador inclui:
Entrada do front-end do cliente: completa a descriptografia TLS, amostragem QoS e roteamento geográfico.
Compreensão da consulta: realizar correção ortográfica, expansão de sinônimos e análise de intenção.
Recuperação de candidatos: usar índices invertidos e índices vetoriais para a triagem inicial.
Classificação em múltiplos níveis: Filtrar as páginas candidatas para cerca de 1000 através de características leves.
Classificação principal de aprendizado profundo: usar tecnologias como RankBrain e Neural Matching para entender o significado das consultas.
Reorganização Profunda: Aplicar o modelo BERT para classificar documentos de forma detalhada.
Esta arquitetura já parece antiga na era da IA e dos grandes dados, e as necessidades de interação dos usuários com o navegador estão a mudar.
As razões pelas quais a IA está a remodelar o navegador
Os navegadores continuarão a existir, pois são plataformas universais, não apenas para ler dados, mas também como uma entrada universal para inserir dados. O mundo precisa gerar dados e interagir com sites, e os navegadores que integram informações personalizadas dos usuários ainda estarão amplamente presentes.
O navegador é um local de armazenamento de conteúdo personalizado:
A profunda transformação das formas de interação
O comportamento de uso do navegador pode ser dividido em leitura de dados, entrada de dados e interação de dados. O LLM mudou a eficiência e a forma de leitura de dados, sendo que a busca baseada em palavras-chave parece antiquada e ineficiente.
Estudos mostram que quase 63% das pesquisas no Google são comportamentos de "zero cliques". Os usuários costumam obter informações diretamente na página de resultados de busca. No entanto, 44% dos entrevistados acreditam que os resultados naturais regulares são mais confiáveis do que os resumos destacados.
Os navegadores de IA precisam explorar formas de interação adequadas, especialmente na leitura de dados, uma vez que o "problema da alucinação" dos modelos atuais ainda não foi resolvido.
O que realmente desencadeou a revolução do navegador foi a camada de interação de dados. Os usuários estão cada vez mais inclinados a usar linguagem natural para descrever tarefas complexas, e essas Tarefas Agenciais estão sendo assumidas por Agentes de IA.
O navegador do futuro deve ser projetado para total automação, considerando:
Uso do Navegador
O uso do navegador construiu uma verdadeira camada semântica, criando uma arquitetura de reconhecimento semântico para a próxima geração de navegadores. Ele redecodifica o DOM tradicional em "DOM semântico", permitindo que os agentes operem com precisão sem precisar de "coordenadas de pontos de visualização".
Principais características:
Uma vez que este conjunto de padrões seja introduzido no W3C, irá resolver significativamente os problemas de entrada nos navegadores.
ARC
A Browser Company afirmou que o navegador ARC entrará em manutenção regular, enquanto a equipe foca no navegador DIA voltado para IA. Eles preveem que as páginas da Web deixarão de ser a principal interface de interação, mas esse julgamento subestima o papel do navegador.
Os grandes modelos são excelentes na captura de intenções, mas têm uma capacidade insuficiente de suportar densidade de informações. Páginas web dedicadas ainda têm vantagens em cenários de interação complexos. A equipe ARC não conseguiu diferenciar as dimensões de entrada e saída da interação, ignorando o papel central do navegador na apresentação de informações e na experiência personalizada.
Para realmente desafiar o Chrome, é necessário uma reestruturação fundamental do modo de renderização do navegador, adaptando-se às necessidades de interação sob a liderança do Agente de IA, especialmente no que diz respeito ao design da arquitetura do lado de entrada.
Perplexidade
Perplexity é um motor de busca de IA, com uma avaliação recente de 14 bilhões de dólares. Processa mais de 400 milhões de consultas de busca por mês, com mais de 30 milhões de usuários ativos mensais.
Está a construir um navegador nativo chamado Comet, com planos para integrar profundamente o motor de respostas da Perplexity. No entanto, ainda é necessário resolver o problema dos altos custos de pesquisa e das baixas margens de lucro.
O Google também está a realizar uma reestruturação com IA, lançando uma nova experiência de separadores do navegador chamada "Project Mariner". Apenas imitar funcionalidades não é suficiente para representar uma ameaça ao Google; um verdadeiro avanço requer uma reestruturação da arquitetura do navegador a partir da base.
Brave
Brave é um navegador Crypto bastante bem-sucedido, baseado na arquitetura Chromium. O número de usuários ativos mensais atinge 82,7 milhões, com uma quota de mercado de cerca de 1%-1,5%.
O Brave planeia atualizar-se para um navegador de IA prioritário em privacidade, mas está limitado à obtenção de dados dos utilizadores, com um nível de personalização do modelo grande relativamente baixo. O seu assistente de IA, Leo, é mais semelhante a um plugin externo, sem uma estratégia clara de transição para um Agente de IA.
Donut
Donut é um projeto inicial de Agentic Browser na indústria Crypto, que recebeu 7 milhões de dólares em financiamento. O objetivo é alcançar a capacidade integrada de "exploração-decisão-execução nativa de criptomoedas".
O núcleo reside na combinação de caminhos de execução automatizados nativos da criptografia. No futuro, o Agente pode substituir os motores de busca como a principal entrada de tráfego, e os empreendedores irão competir pelo tráfego de acesso e conversão gerado pela execução do Agente.
Conselhos para empreendedores
O navegador continua a ser a maior "porta de entrada" não reestruturada do mundo da internet. O verdadeiro ponto de viragem reside no "lado da entrada" - como fazer com que o Agente de IA invoque proativamente produtos para completar tarefas.
Os empreendedores devem considerar o design do produto a partir de três dimensões:
Normalização da estrutura da interface: o produto é "chamável"? Suporta estrutura DOM semântica ou mapeamento JSON?
Identidade e Acesso: Será que o Agent consegue "superar as barreiras de confiança"? Especialmente no cenário Web3, é necessária uma capacidade unificada de identidade e assinatura.
Compreensão adicional do mecanismo de fluxo: de SEO para AEO/ATF, o produto deve ter uma granularidade de tarefa clara, adaptando-se à sintaxe de chamada de diferentes estruturas LLM.
Os projetos de empreendedorismo do futuro devem permitir que os navegadores existentes sirvam o Agent, criando uma ponte para a nova geração de "fluxo de comandos". É necessário construir a "sintaxe de interface" que chama o mundo do Agent, tornando-se um elo na cadeia de confiança dos agentes e construindo o "castelo de APIs" para o próximo modo de busca.
Na era do Web3 + AI Agent, a chave está em capturar a intenção de execução do Agent através da chamada da cadeia, em vez de depender apenas da interface do usuário para captar a atenção do utilizador.