Технології генерації відео на базі штучного інтелекту роблять прорив: Web3 стикається з новими можливостями та викликами

robot
Генерація анотацій у процесі

Прорив у технологіях генерації відео на основі штучного інтелекту та зв'язок з Web3

Нещодавніми помітними досягненнями в сфері ШІ є прориви в технології генерації мультимедійних відео. Ця технологія розвивалася від початкового чисто текстового генерування відео до сьогоднішнього інтегрованого генерування тексту, зображень і звуку.

Кілька важливих випадків технологічних проривів включають:

  1. Відкрита платформа EX-4D, розроблена великою технологічною компанією, може перетворювати звичайні відео в контент 4D з вільним кутом огляду, схвалення користувачів перевищує 70%. Ця технологія дозволяє автоматично генерувати ефекти перегляду з будь-якого кута, що раніше вимагало професійної команди 3D-моделювання.

  2. Платформа "Генерація образів" певної пошукової компанії стверджує, що може створити 10-секундне відео "кінематографічної" якості з одного зображення. Однак правдивість цієї заяви ще потребує перевірки.

  3. Технологія Veo від міжнародного технологічного гіганта може синхронно генерувати 4K відео та навколишній звук. Ключ до цієї технології полягає в досягненні справжнього семантичного відповідності, що дозволяє точно відповідати зображенням і звуком у складних сценах.

  4. Технологія ContentV певної платформи короткометражних відео має 80 мільярдів параметрів і може генерувати 1080p відео за 2,3 секунди, вартість складає 3,67 юанів за 5 секунд. Хоча контроль витрат непоганий, проте є можливості для покращення якості генерації в складних сценах.

Ці технологічні прориви мають велике значення для якості відео, витрат на генерацію та сфер застосування. З технологічної точки зору, складність мультимодального відеогенерації є експоненційною і включає велику кількість пікселів, часову узгодженість, синхронізацію звуку та просторову узгодженість 3D. Актуальним рішенням є реалізація через модульну декомпозицію та співпрацю великих моделей.

У плані витрат, за рахунок оптимізації архітектури висновків, включаючи ієрархічні стратегії генерації, механізми повторного використання кешу та динамічне розподілення ресурсів, значно знижено витрати на генерацію.

Ці технологічні досягнення завдали величезного удару традиційній індустрії виробництва відео. Технології штучного інтелекту скоротили процес, який раніше вимагав великої кількості обладнання, приміщень, акторів та постпродакшну, до простого введення підказок і кількох хвилин очікування, а також можуть досягати ефектів, які традиційна зйомка важко могла б реалізувати. Це може сприяти переосмисленню всієї економіки творців.

Отже, яка зв'язок між цими змінами Web2 AI технологій та Web3 AI?

  1. Структура попиту на обчислювальну потужність змінилася. Генерація мультимодальних відео потребує різноманітних комбінацій обчислювальної потужності, що створює новий попит на розподілену незайняту обчислювальну потужність, різні розподілені моделі доопрацювання, алгоритми та платформи для інференції.

  2. Потреби в позначенні даних посилюються. Для створення професійного відео потрібні точні описи сцен, референсні зображення, аудіо стиль, траєкторії руху камери та умови освітлення тощо. Механізм винагород Web3 може заохочувати фахівців надавати високоякісні дані.

  3. Технології штучного інтелекту розвиваються в напрямку модульної співпраці, що само по собі є новою потребою децентралізованих платформ. У майбутньому обчислювальна потужність, дані, моделі та механізми стимулювання можуть утворити самопідсилювальний позитивний цикл, що сприятиме глибокій інтеграції Web3 AI та Web2 AI сценаріїв.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Поділіться
Прокоментувати
0/400
BankruptWorkervip
· 07-17 23:22
Знову доведеться втратити роботу.
Переглянути оригіналвідповісти на0
ChainMelonWatchervip
· 07-17 09:00
А що з цього? Створення контенту все ще залежить від людей.
Переглянути оригіналвідповісти на0
New_Ser_Ngmivip
· 07-15 19:04
Це хто витримає, рано чи пізно буде знищений штучним інтелектом.
Переглянути оригіналвідповісти на0
MrRightClickvip
· 07-15 19:04
Технології прийшли, редактор залишиться без роботи.
Переглянути оригіналвідповісти на0
not_your_keysvip
· 07-15 19:01
Марко Марко, ця хвиля AI обов'язково призведе до великих подій.
Переглянути оригіналвідповісти на0
  • Закріпити