Navegador de IA: el nuevo campo de batalla y oportunidades de la tercera guerra de navegadores

Navegador AI: El campo de batalla de la tercera guerra de navegadores

La tercera guerra de los navegadores se está desarrollando silenciosamente. Desde Netscape hasta IE, y luego a Firefox y Chrome, la competencia entre navegadores ha sido una manifestación concentrada del control de la plataforma y el cambio de paradigmas tecnológicos. Chrome ha logrado la posición dominante gracias a su velocidad de actualización y su conectividad ecológica, mientras que Google ha formado un ciclo cerrado de entrada de información a través de su estructura de "duopolio" entre búsqueda y navegador.

Sin embargo, este patrón está empezando a tambalearse. El auge de los modelos de lenguaje de gran tamaño (LLM) ha llevado a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que está reduciendo el comportamiento tradicional de clics en páginas web. Al mismo tiempo, los rumores de que Apple tiene la intención de reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, generando inquietud en el mercado sobre la "ortodoxia de la búsqueda".

Los navegadores están enfrentando una transformación de roles. No solo son herramientas para mostrar páginas web, sino que también son contenedores de múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad de privacidad. Aunque el Agente de IA es poderoso, para realizar interacciones complejas en la página, invocar datos de identidad locales y controlar elementos de la página web, todavía necesita apoyarse en los límites de confianza y el sandbox funcional del navegador. Los navegadores están pasando de ser interfaces humanas a convertirse en plataformas de llamadas del sistema para Agentes.

Lo que realmente podría romper el actual panorama del mercado de navegadores no es otro "mejor Chrome", sino una nueva estructura de interacción: no se trata de la presentación de información, sino de la invocación de tareas. El futuro del navegador debe estar diseñado para agentes de IA: no solo que puedan leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de la página, transformando la interfaz visual en un texto estructurado que puede ser invocado por LLM, logrando así un mapeo de la página a instrucciones y reduciendo drásticamente el costo de interacción.

Los proyectos principales han comenzado a experimentar: Perplexity construye un navegador nativo llamado Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es: intentan reconstruir la entrada del navegador, en lugar de embellecer su capa de salida.

Para los emprendedores, las oportunidades se encuentran en la relación triangular entre la entrada, la estructura y el agente. El navegador, como la interfaz que invoca al mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" que sean estructurables, invocables y de confianza, podrá convertirse en parte de una nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma del producto y el pensamiento de diseño están siendo reconfigurados. La tercera guerra de los navegadores se libra en la "entrada" y no en la "exhibición"; lo que decide la victoria ya no es quién capta la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada para la invocación.

Breve historia del desarrollo de los navegadores

A principios de los años 90, Netscape Navigator apareció y abrió las puertas del mundo digital a millones de usuarios. Microsoft luego integró Internet Explorer en el sistema Windows, desmantelando la posición de mercado de Netscape.

Los ingenieros de Netscape hicieron público el código fuente del navegador, estableciendo las bases para el proyecto Mozilla. Firefox logró avances en la experiencia del usuario, el ecosistema de complementos, la seguridad, entre otros, marcando la victoria del espíritu de código abierto.

En 2008, Google lanzó el navegador Chrome, construido sobre el proyecto de código abierto Chromium y el motor WebKit. Chrome, gracias a sus actualizaciones frecuentes y a una experiencia unificada en todas las plataformas, se elevó rápidamente, superando a Firefox en 2011 y luego superando a IE seis meses después, completando la transición de retador a dominante.

En la década de 2020, la cuota de mercado global de Chrome se mantiene estable en alrededor del 65%. El motor de búsqueda de Google y el navegador Chrome constituyen un sistema de doble hegemonía que controla tanto la entrada de búsqueda como la "primera ventana" a través de la cual los usuarios acceden a la red.

Con el auge de los modelos de lenguaje grande (LLM), la búsqueda tradicional se ve afectada. En 2024, la cuota de mercado de búsqueda de Google cayó del 93% al 89%. Los rumores de que Apple podría lanzar su propio motor de búsqueda de IA han sacudido aún más el pilar de ganancias de Alphabet, generando inquietud en el mercado sobre el futuro de la era de búsqueda.

Desde Navigator hasta Chrome, desde el idealismo del código abierto hasta la comercialización publicitaria, desde navegadores ligeros hasta asistentes de búsqueda con inteligencia artificial, la lucha por los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. Quien controle la entrada, definirá el futuro.

La arquitectura obsoleta de los navegadores modernos

La arquitectura de los navegadores tradicionales incluye:

  1. Entrada del cliente en el front-end: Completar la desincriptación TLS, muestreo de QoS y enrutamiento geográfico.

  2. Comprensión de la consulta: realizar corrección ortográfica, expansión de sinónimos y análisis de intenciones.

  3. Recuperación de candidatos: usar índices invertidos y índices vectoriales para la selección preliminar.

  4. Ordenación multinivel: Filtrar las páginas candidatas a aproximadamente 1000 a través de características ligeras.

  5. Aprendizaje profundo de clasificación principal: utiliza tecnologías como RankBrain y Neural Matching para comprender la semántica de las consultas.

  6. Reordenamiento profundo: aplicar el modelo BERT para clasificar los documentos de manera precisa.

Esta arquitectura ha quedado obsoleta en la era de la IA y los grandes datos, y las necesidades de interacción de los usuarios con el navegador están cambiando.

Razones por las que la IA está remodelando los navegadores

Los navegadores seguirán existiendo, ya que son plataformas universales, no solo para leer datos, sino también como entradas universales para ingresar datos. El mundo necesita generar datos e interactuar con sitios web, y los navegadores que integran información personalizada de los usuarios seguirán existiendo ampliamente.

El navegador es un lugar de almacenamiento de contenido personalizado:

  • La mayoría de los modelos grandes están alojados en la nube, lo que dificulta la llamada directa a los datos sensibles locales.
  • Se requiere obtener nuevamente la autorización del usuario para enviar todos los datos a un modelo de terceros.
  • La verificación automática del código de verificación, el uso de la cámara y otras funciones deben completarse dentro del sandbox del navegador.
  • El contexto de datos depende en gran medida del navegador, incluidas las pestañas, las cookies, la caché, etc.

Transformación profunda de las formas de interacción

El comportamiento del navegador se puede dividir en lectura de datos, entrada de datos e interacción de datos. LLM ha cambiado la eficiencia y la forma de lectura de datos, ya que la búsqueda basada en palabras clave ha quedado obsoleta y es ineficiente.

Los estudios muestran que cerca del 63% de las consultas en Google pertenecen al comportamiento de "cero clics". Los usuarios tienden a obtener información directamente de la página de resultados de búsqueda. Sin embargo, el 44% de los encuestados cree que los resultados naturales convencionales son más confiables que los fragmentos destacados.

El navegador AI necesita explorar formas de interacción adecuadas, especialmente en lo que respecta a la lectura de datos, ya que el "problema de las alucinaciones" de los modelos grandes aún no se ha erradicado.

Lo que realmente desencadena la revolución del navegador es la capa de interacción de datos. Los usuarios tienden cada vez más a usar lenguaje natural para describir tareas complejas, estas Tareas Agénticas están siendo asumidas por Agentes de IA.

El navegador del futuro debe ser diseñado para la automatización total, considerando:

  • ¿Cómo equilibrar la experiencia de lectura humana con la interpretabilidad del agente de IA?
  • Cómo servir a los usuarios y modelos de agencia en la misma página

Uso del Navegador

Browser Use ha construido una verdadera capa semántica para desarrollar una arquitectura de reconocimiento semántico para la próxima generación de navegadores. Ha vuelto a decodificar el DOM tradicional en "DOM semántico", permitiendo a los agentes operar con precisión sin necesidad de "coordenadas de puntos de vista".

Características principales:

  • Abstracta los elementos interactivos en fragmentos de JSON, junto con metadatos
  • Traducir toda la página en una "lista de nodos semánticos" aplanada.
  • Recibir instrucciones de alto nivel de la salida de LLM y reproducirlas en un navegador real

Una vez que este conjunto de estándares sea introducido en W3C, se resolverán significativamente los problemas de entrada en los navegadores.

ARC

La empresa Browser Company ha anunciado que el navegador ARC entrará en mantenimiento regular, y el equipo enfocará su atención en el navegador orientado a la IA, DIA. Predicen que las páginas web ya no serán la principal interfaz de interacción, pero este juicio subestima el papel del navegador.

Los grandes modelos son excelentes en la captura de intenciones, pero tienen una capacidad insuficiente para soportar la densidad de información. Las páginas web especializadas siguen teniendo ventajas en escenarios de interacción compleja. El equipo de ARC no logró diferenciar entre las dimensiones de entrada y salida de la interacción, ignorando el papel central del navegador en la presentación de información y la experiencia personalizada.

Lo que realmente puede desafiar a Chrome debe reformular fundamentalmente el modo de renderizado del navegador, adaptándose a las necesidades de interacción bajo la dirección de un Agente de IA, especialmente en el diseño de la arquitectura del lado de entrada.

Perplejidad

Perplexity es un motor de búsqueda de IA, con una valoración reciente de 14 mil millones de dólares. Procesa más de 400 millones de consultas de búsqueda al mes y tiene más de 30 millones de usuarios activos mensuales.

Está construyendo el navegador nativo Comet, que planea integrar profundamente el motor de respuestas de Perplexity. Sin embargo, aún se deben resolver los problemas de altos costos de búsqueda y bajas márgenes de beneficio.

Google también está llevando a cabo una transformación de IA, lanzando una nueva experiencia de pestaña del navegador "Project Mariner". La mera imitación de funciones no puede representar una amenaza para Google; un verdadero avance requiere una reconstrucción desde la base de la arquitectura del navegador.

Valiente

Brave es un navegador Crypto bastante exitoso, basado en la arquitectura Chromium. Tiene 82.7 millones de usuarios activos mensuales y una cuota de mercado de aproximadamente 1%-1.5%.

Brave planea actualizarse a un navegador AI priorizando la privacidad, pero está limitado por la obtención de datos de los usuarios, con un bajo nivel de personalización del modelo grande. Su asistente AI Leo es más parecido a un complemento, aún no hay una estrategia clara de transición total hacia un Agente AI.

Donut

Donut es un proyecto emergente de navegador agentico en la industria de las criptomonedas, que ha obtenido 7 millones de dólares en financiamiento. Su objetivo es lograr la capacidad integrada de "exploración - decisión - ejecución nativa en criptomonedas".

El núcleo radica en combinar la ruta de ejecución automática nativa de la criptografía. En el futuro, los Agentes podrían reemplazar a los motores de búsqueda como la principal entrada de tráfico, y los emprendedores competirán por el tráfico de acceso y conversión que trae la ejecución del Agente.

Consejos para emprendedores

El navegador sigue siendo la "puerta de entrada" más grande y no reconstruida del mundo de Internet. La verdadera clave está en el "lado de entrada" - cómo hacer que el Agente de IA llame activamente a los productos para completar tareas.

Los emprendedores deben considerar el diseño del producto desde tres dimensiones:

  1. Estandarización de la estructura de la interfaz: ¿el producto es "llamable"? ¿Soporta una estructura DOM semántica o un mapeo JSON?

  2. Identidad y acceso: ¿puede ayudar al Agente a "superar las barreras de confianza"? Especialmente en el escenario de Web3, se necesita una capacidad de identidad y firma unificada.

  3. Entender nuevamente el mecanismo de tráfico: de SEO a AEO/ATF, el producto debe tener una claridad en la granularidad de la tarea, adaptándose a la sintaxis de llamada de diferentes marcos LLM.

Los futuros proyectos de emprendimiento deberían permitir que los navegadores existentes sirvan a los Agentes, estableciendo un puente para la nueva generación de "flujos de instrucciones". Se debe construir la "sintaxis de interfaz" para la llamada del Agente al mundo, convirtiéndose en un eslabón de la cadena de confianza de los agentes, y construir el "castillo de API" del próximo modelo de búsqueda.

En la era de Web3 + AI Agent, la clave está en captar la intención de ejecución del Agente a través de la llamada a la cadena, en lugar de depender únicamente de la interfaz de usuario para captar la atención del usuario.

AGENT10.37%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Compartir
Comentar
0/400
RugpullSurvivorvip
· 07-06 21:50
Edge va a hacer un regreso, ¿verdad?
Ver originalesResponder0
FUDwatchervip
· 07-04 14:17
La época ha cambiado amigo
Ver originalesResponder0
TokenUnlockervip
· 07-04 14:17
debe ser todo en el navegador de IA
Ver originalesResponder0
StealthDeployervip
· 07-04 14:17
La batalla apenas ha comenzado.
Ver originalesResponder0
FomoAnxietyvip
· 07-04 14:04
El mercado siempre es cíclico.
Ver originalesResponder0
GasBanditvip
· 07-04 14:04
El dominio va a cambiar.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)