Đột phá trong công nghệ sản xuất video AI và mối liên hệ với Web3
Gần đây, những tiến bộ nổi bật nhất trong lĩnh vực AI không gì khác ngoài sự đột phá của công nghệ tạo video đa mô thức. Công nghệ này đã từ việc chỉ tạo video từ văn bản thuần túy, phát triển đến khả năng tích hợp văn bản, hình ảnh và âm thanh vào quy trình tạo toàn diện.
Một số ví dụ về những đột phá công nghệ đáng chú ý bao gồm:
Khung EX-4D mã nguồn mở của một công ty công nghệ lớn có thể chuyển đổi video thông thường thành nội dung 4D với góc nhìn tự do, được người dùng công nhận hơn 70%. Công nghệ này cho phép video thông thường tự động tạo ra hiệu ứng xem từ bất kỳ góc độ nào, điều mà trước đây cần một đội ngũ mô hình 3D chuyên nghiệp để thực hiện.
Một công ty công cụ tìm kiếm có nền tảng "Hội Tưởng" tuyên bố có thể tạo ra video 10 giây với chất lượng "phim" chỉ từ một bức ảnh. Tuy nhiên, tính xác thực của tuyên bố này vẫn cần được xác minh.
Công nghệ Veo của một tập đoàn công nghệ quốc tế có thể đồng bộ tạo ra video 4K và âm thanh môi trường. Chìa khóa của công nghệ này nằm ở việc đạt được sự phù hợp thực sự ở mức độ ngữ nghĩa, có khả năng đạt được sự tương ứng chính xác giữa hình ảnh và âm thanh trong các cảnh phức tạp.
Công nghệ ContentV của một nền tảng video ngắn có 80 tỷ tham số, có thể tạo ra video 1080p trong 2,3 giây, với chi phí là 3,67 nhân dân tệ/5 giây. Mặc dù việc kiểm soát chi phí khá tốt, nhưng vẫn còn không gian để cải thiện chất lượng tạo ra trong các cảnh phức tạp.
Các bước đột phá công nghệ này có ý nghĩa quan trọng trong chất lượng video, chi phí sản xuất và các tình huống ứng dụng. Từ góc độ công nghệ, độ phức tạp của việc tạo video đa phương thức là bậc số mũ, liên quan đến một lượng lớn điểm pixel, tính liên tục theo thời gian, đồng bộ âm thanh và sự nhất quán trong không gian 3D. Giải pháp hiện tại là thực hiện thông qua phân tách mô-đun và sự hợp tác của các mô hình lớn.
Về chi phí, thông qua việc tối ưu hóa kiến trúc suy diễn, bao gồm chiến lược tạo ra theo cấp bậc, cơ chế tái sử dụng bộ nhớ đệm và phân bổ tài nguyên động, chi phí tạo ra đã giảm đáng kể.
Những tiến bộ công nghệ này đã mang lại cú sốc lớn cho ngành sản xuất video truyền thống. Công nghệ AI đã rút gọn quy trình vốn cần rất nhiều thiết bị, địa điểm, diễn viên và sản xuất hậu kỳ xuống chỉ còn việc nhập các từ khóa đơn giản và chờ vài phút, đồng thời có thể đạt được những hiệu ứng mà việc quay phim truyền thống khó có thể đạt được. Điều này có thể thúc đẩy sự tái cấu trúc toàn bộ nền kinh tế sáng tạo.
Vậy, những cuộc cách mạng công nghệ AI Web2 này có liên quan gì đến AI Web3?
Cấu trúc nhu cầu sức mạnh tính toán đã thay đổi. Việc tạo video đa phương thức yêu cầu sự kết hợp sức mạnh tính toán đa dạng, điều này tạo ra nhu cầu mới cho sức mạnh tính toán phân tán nhàn rỗi, các loại mô hình tinh chỉnh phân tán, thuật toán và nền tảng suy diễn.
Nhu cầu về dữ liệu đánh dấu gia tăng. Việc tạo ra video chuyên nghiệp cần các mô tả cảnh chính xác, hình ảnh tham khảo, phong cách âm thanh, quỹ đạo chuyển động của máy ảnh và điều kiện ánh sáng cùng các dữ liệu chuyên môn khác. Cơ chế khuyến khích của Web3 có thể khuyến khích các chuyên gia cung cấp dữ liệu chất lượng cao.
Công nghệ AI đang phát triển theo hướng hợp tác mô-đun, điều này chính là nhu cầu mới đối với các nền tảng phi tập trung. Trong tương lai, sức mạnh tính toán, dữ liệu, mô hình và cơ chế khuyến khích có thể tạo thành một vòng lặp tích cực tự củng cố, thúc đẩy sự tích hợp sâu sắc giữa các cảnh Web3 AI và Web2 AI.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
10 thích
Phần thưởng
10
5
Chia sẻ
Bình luận
0/400
BankruptWorker
· 07-17 23:22
Lại sắp thất nghiệp rồi.
Xem bản gốcTrả lời0
ChainMelonWatcher
· 07-17 09:00
Tạo ra thì sao, nội dung sáng tạo vẫn phải dựa vào con người nhé.
Xem bản gốcTrả lời0
New_Ser_Ngmi
· 07-15 19:04
Cái này ai chịu được chứ, sớm muộn gì cũng bị AI nghiền nát.
Xem bản gốcTrả lời0
MrRightClick
· 07-15 19:04
Công nghệ đã đến, biên tập viên sẽ thất nghiệp mất.
Xem bản gốcTrả lời0
not_your_keys
· 07-15 19:01
Mạc Mạc, đợt AI này nhất định sẽ có chuyện lớn xảy ra.
Công nghệ tạo video AI đột phá, Web3 đối mặt với cơ hội và thách thức mới
Đột phá trong công nghệ sản xuất video AI và mối liên hệ với Web3
Gần đây, những tiến bộ nổi bật nhất trong lĩnh vực AI không gì khác ngoài sự đột phá của công nghệ tạo video đa mô thức. Công nghệ này đã từ việc chỉ tạo video từ văn bản thuần túy, phát triển đến khả năng tích hợp văn bản, hình ảnh và âm thanh vào quy trình tạo toàn diện.
Một số ví dụ về những đột phá công nghệ đáng chú ý bao gồm:
Khung EX-4D mã nguồn mở của một công ty công nghệ lớn có thể chuyển đổi video thông thường thành nội dung 4D với góc nhìn tự do, được người dùng công nhận hơn 70%. Công nghệ này cho phép video thông thường tự động tạo ra hiệu ứng xem từ bất kỳ góc độ nào, điều mà trước đây cần một đội ngũ mô hình 3D chuyên nghiệp để thực hiện.
Một công ty công cụ tìm kiếm có nền tảng "Hội Tưởng" tuyên bố có thể tạo ra video 10 giây với chất lượng "phim" chỉ từ một bức ảnh. Tuy nhiên, tính xác thực của tuyên bố này vẫn cần được xác minh.
Công nghệ Veo của một tập đoàn công nghệ quốc tế có thể đồng bộ tạo ra video 4K và âm thanh môi trường. Chìa khóa của công nghệ này nằm ở việc đạt được sự phù hợp thực sự ở mức độ ngữ nghĩa, có khả năng đạt được sự tương ứng chính xác giữa hình ảnh và âm thanh trong các cảnh phức tạp.
Công nghệ ContentV của một nền tảng video ngắn có 80 tỷ tham số, có thể tạo ra video 1080p trong 2,3 giây, với chi phí là 3,67 nhân dân tệ/5 giây. Mặc dù việc kiểm soát chi phí khá tốt, nhưng vẫn còn không gian để cải thiện chất lượng tạo ra trong các cảnh phức tạp.
Các bước đột phá công nghệ này có ý nghĩa quan trọng trong chất lượng video, chi phí sản xuất và các tình huống ứng dụng. Từ góc độ công nghệ, độ phức tạp của việc tạo video đa phương thức là bậc số mũ, liên quan đến một lượng lớn điểm pixel, tính liên tục theo thời gian, đồng bộ âm thanh và sự nhất quán trong không gian 3D. Giải pháp hiện tại là thực hiện thông qua phân tách mô-đun và sự hợp tác của các mô hình lớn.
Về chi phí, thông qua việc tối ưu hóa kiến trúc suy diễn, bao gồm chiến lược tạo ra theo cấp bậc, cơ chế tái sử dụng bộ nhớ đệm và phân bổ tài nguyên động, chi phí tạo ra đã giảm đáng kể.
Những tiến bộ công nghệ này đã mang lại cú sốc lớn cho ngành sản xuất video truyền thống. Công nghệ AI đã rút gọn quy trình vốn cần rất nhiều thiết bị, địa điểm, diễn viên và sản xuất hậu kỳ xuống chỉ còn việc nhập các từ khóa đơn giản và chờ vài phút, đồng thời có thể đạt được những hiệu ứng mà việc quay phim truyền thống khó có thể đạt được. Điều này có thể thúc đẩy sự tái cấu trúc toàn bộ nền kinh tế sáng tạo.
Vậy, những cuộc cách mạng công nghệ AI Web2 này có liên quan gì đến AI Web3?
Cấu trúc nhu cầu sức mạnh tính toán đã thay đổi. Việc tạo video đa phương thức yêu cầu sự kết hợp sức mạnh tính toán đa dạng, điều này tạo ra nhu cầu mới cho sức mạnh tính toán phân tán nhàn rỗi, các loại mô hình tinh chỉnh phân tán, thuật toán và nền tảng suy diễn.
Nhu cầu về dữ liệu đánh dấu gia tăng. Việc tạo ra video chuyên nghiệp cần các mô tả cảnh chính xác, hình ảnh tham khảo, phong cách âm thanh, quỹ đạo chuyển động của máy ảnh và điều kiện ánh sáng cùng các dữ liệu chuyên môn khác. Cơ chế khuyến khích của Web3 có thể khuyến khích các chuyên gia cung cấp dữ liệu chất lượng cao.
Công nghệ AI đang phát triển theo hướng hợp tác mô-đun, điều này chính là nhu cầu mới đối với các nền tảng phi tập trung. Trong tương lai, sức mạnh tính toán, dữ liệu, mô hình và cơ chế khuyến khích có thể tạo thành một vòng lặp tích cực tự củng cố, thúc đẩy sự tích hợp sâu sắc giữa các cảnh Web3 AI và Web2 AI.