La tecnología de generación de videos AI rompe barreras, Web3 enfrenta nuevas oportunidades y desafíos.

robot
Generación de resúmenes en curso

Avances en la tecnología de generación de videos con IA y su relación con Web3

Recientemente, el avance más notable en el campo de la IA es el breakthrough en la tecnología de generación de video multimodal. Esta tecnología ha evolucionado desde la generación de video a partir de texto puro hasta la capacidad actual de integrar texto, imágenes y audio en una generación de cadena completa.

Varios casos de innovaciones tecnológicas dignos de atención incluyen:

  1. El marco EX-4D de una gran empresa tecnológica de código abierto puede convertir videos normales en contenido 4D de libre visualización, con una tasa de aceptación de los usuarios superior al 70%. Esta tecnología permite que los videos normales generen automáticamente efectos de visualización desde cualquier ángulo, algo que en el pasado requería un equipo profesional de modelado 3D para lograr.

  2. La plataforma "Hui Xiang" de una empresa de motores de búsqueda afirma que puede generar un video de 10 segundos de calidad "cinematográfica" a partir de una imagen. Sin embargo, la veracidad de esta afirmación aún debe ser verificada.

  3. La tecnología Veo de un gigante tecnológico internacional puede generar simultáneamente video 4K y sonido ambiental. La clave de esta tecnología radica en lograr una coincidencia real a nivel semántico, lo que permite una correspondencia precisa entre las acciones visuales y el sonido en escenas complejas.

  4. La tecnología ContentV de una plataforma de videos cortos tiene 8 mil millones de parámetros y puede generar video en 1080p en 2.3 segundos, con un costo de 3.67 yuanes/5 segundos. Aunque el control de costos es bueno, aún hay margen para mejorar la calidad de generación en escenas complejas.

Estos avances tecnológicos tienen un gran significado en aspectos como la calidad del video, el costo de generación y los escenarios de aplicación. Desde un punto de vista técnico, la complejidad de la generación de video multimodal es exponencial, involucrando una gran cantidad de píxeles, coherencia temporal, sincronización de audio y consistencia en el espacio 3D. La solución actual se logra a través de la descomposición modular y la colaboración en la división del trabajo entre grandes modelos.

En términos de costos, se ha reducido significativamente el costo de generación a través de la optimización de la arquitectura de inferencia, incluyendo estrategias de generación jerárquica, mecanismos de reutilización de caché y asignación dinámica de recursos.

Estos avances tecnológicos han tenido un gran impacto en la industria tradicional de la producción de videos. La tecnología de IA ha reducido un proceso que originalmente requería una gran cantidad de equipos, espacios, actores y postproducción a simplemente ingresar palabras clave y esperar unos minutos, logrando efectos que son difíciles de alcanzar con la filmación tradicional. Esto podría promover una reestructuración en toda la economía de creadores.

Entonces, ¿cuál es la relación entre estas transformaciones de las tecnologías de IA de Web2 y la IA de Web3?

  1. La estructura de la demanda de potencia de cálculo ha cambiado. La generación de videos multimodales requiere una combinación diversificada de potencia de cálculo, lo que crea una nueva demanda para la potencia de cálculo distribuida inactiva, diversos modelos de ajuste fino distribuidos, algoritmos y plataformas de inferencia.

  2. Aumento de la demanda de etiquetado de datos. Generar videos de nivel profesional requiere descripciones de escenas precisas, imágenes de referencia, estilos de audio, trayectorias de movimiento de la cámara y condiciones de iluminación, entre otros datos profesionales. El mecanismo de incentivos de Web3 puede alentar a los profesionales a proporcionar materiales de datos de alta calidad.

  3. El desarrollo de la tecnología de IA hacia una colaboración modular es en sí mismo una nueva demanda de plataformas descentralizadas. En el futuro, la potencia de cálculo, los datos, los modelos y los mecanismos de incentivos podrían formar un ciclo virtuoso de auto-refuerzo, impulsando la fusión profunda entre los escenarios de IA de Web3 y Web2.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
BankruptWorkervip
· 07-17 23:22
Otra vez me voy a quedar sin trabajo.
Ver originalesResponder0
ChainMelonWatchervip
· 07-17 09:00
¿Y qué hay de la generación? La creación de contenido aún depende de las personas, ¡ah!
Ver originalesResponder0
New_Ser_Ngmivip
· 07-15 19:04
¿Quién puede soportar esto? Tarde o temprano será destrozado por la IA.
Ver originalesResponder0
MrRightClickvip
· 07-15 19:04
La tecnología ha llegado, el editor se quedará sin trabajo.
Ver originalesResponder0
not_your_keysvip
· 07-15 19:01
Marcos, esta ola de IA seguramente traerá grandes acontecimientos.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)