Sau khi ChatGPT được phát hành vào cuối năm ngoái, các công ty Trung Quốc đã phát hành ít nhất 79 mẫu lớn cơ bản. Tuy nhiên, hầu hết các mô hình lớn được thế giới bên ngoài coi là có khoảng cách kỹ thuật với ChatGPT. Sắp có mô hình kinh doanh quy mô lớn, Trung Quốc cần loại mô hình quy mô lớn nào?
Vào tháng 12 năm 2022, OpenAI, một công ty khởi nghiệp về AI do Microsoft đầu tư, đã ra mắt AI ChatGPT đàm thoại. ChatGPT thực chất là một mô hình lớn bằng ngôn ngữ GPT do OpenAI phát triển độc lập, chứa gần 180 tỷ tham số. Vào tháng 2 năm nay, Giám đốc điều hành Nvidia Huang Renxun đã nhận xét rằng "ChatGPT đã mở ra thời điểm iPhone cho AI". Huang Renxun tin rằng các mô hình lớn đang hạ thấp ngưỡng phát triển ứng dụng và tất cả các ứng dụng đều đáng để làm lại với các mô hình lớn.
Đây không phải là lời của gia đình Huang Renxun, mọi người đều nhìn thấy cơ hội. Bắt đầu từ tháng 3 năm nay, các công ty Trung Quốc cũng đua nhau tung ra các sản phẩm mô hình quy mô lớn. Chúng bao gồm các công ty hàng đầu, chẳng hạn như mô hình Wenxin của Baidu, mô hình Tongyi của Ali và mô hình công nghiệp của Tencent, cũng như các công ty công nghiệp như Xunfei và SenseTime, cũng như một số công ty mới thành lập. Vào tháng 5, Viện Thông tin Khoa học và Công nghệ Trung Quốc thuộc Bộ Khoa học và Công nghệ đã công bố "Báo cáo nghiên cứu về Bản đồ mô hình lớn trí tuệ nhân tạo của Trung Quốc". Theo báo cáo, tính đến ngày 28 tháng 5, ít nhất 79 mô hình quy mô lớn cơ bản với thông số trên 1 tỷ đã được phát hành tại Trung Quốc.
Số lượng các tham số của mô hình là quan trọng. Hiện tại, các công ty hàng đầu như Baidu và Ali thông báo rằng khối lượng tham số của Wenxin và Tongyi thường ở mức 100 tỷ, chẳng hạn như khối lượng tham số của mô hình lớn Wenxin là 260 tỷ. Thông số của các mô hình lớn của các doanh nghiệp khác hoặc công ty mới thành lập thường ở mức 10 tỷ hoặc 1 tỷ.
**Mặc dù các mô hình AI hiện đang được tung ra thị trường đều được gọi là "mô hình lớn", nhưng số lượng tham số được mặc định coi là một trong những yếu tố quyết định mô hình lớn và mô hình nhỏ. ** Hou Zhenyu, phó chủ tịch của Tập đoàn Baidu, nói với phóng viên Caijing rằng một mô hình có 1 tỷ tham số vào năm 2022 được gọi là mô hình lớn. Nhưng các thông số mô hình lớn hiện nay thường là hàng trăm tỷ. Bởi vì hiệu ứng "sự xuất hiện thông minh" sẽ xuất hiện với hơn 100 tỷ tham số, khả năng khái quát hóa sẽ được hình thành và khả năng phổ quát trong các tình huống khác nhau sẽ được hình thành. Mô hình tinh chỉnh dựa trên mô hình lớn này có hiệu ứng ứng dụng công nghiệp tốt hơn.
**Hiệu ứng "sự xuất hiện thông minh" đề cập đến thực tế là sau khi quy mô mô hình và mức năng lượng tính toán vượt quá một ngưỡng tham số nhất định, hiệu ứng AI sẽ không còn là sự kiện xác suất ngẫu nhiên nữa. **Trong lĩnh vực chung, số lượng tham số càng nhiều thì khả năng xuất hiện trí thông minh nói chung càng lớn và độ chính xác của AI càng cao. Trong trường dọc chuyên dụng, việc thu được kết quả chính xác sẽ dễ dàng hơn sau khi mô hình tham số lớn được cắt và tối ưu hóa.
Mặc dù ít nhất 79 mô hình quy mô lớn đã xuất hiện ở Trung Quốc, nhưng nhiều chuyên gia trong ngành được Caijing phỏng vấn tin rằng các mô hình quy mô lớn đòi hỏi sức mạnh tính toán, thuật toán và tích lũy dữ liệu. Do thiếu chip GPU hiệu suất cao, chi phí mua sắm phần cứng cao và chi phí vận hành cao, có rất ít công ty ở Trung Quốc có dự trữ vốn, ý chí chiến lược và năng lực thực tế để thực hiện thương mại hóa các mô hình lớn. Trong "Cuộc chiến trăm kiểu", thực sự có một khoảng cách giữa hầu hết các sản phẩm và ChatGPT.
Sau sự náo động, cơn sốt người mẫu lớn đang dần trở lại với thực tế. Tư duy hợp lý hơn đang xuất hiện trên thị trường mô hình quy mô lớn trong và ngoài nước-ChatGPT không thể thương mại hóa chỉ có thể là một món đồ chơi và một mô hình quy mô lớn có thể trở thành một ứng dụng doanh nghiệp có giá trị công nghiệp.
Các công ty như Apple, Samsung và JPMorgan Chase đã cấm nhân viên sử dụng ChatGPT do lo ngại về bảo mật. Mặt khác, tốc độ tăng trưởng và giữ chân người dùng ChatGPT cũng đã đạt đến điểm nghẽn. Theo dữ liệu từ công cụ phân tích website SimilarWeb, tốc độ tăng trưởng lưu lượng truy cập của ChatGPT từ tháng 1 đến tháng 5 là 131,6%, 62,5%, 55,8%, 12,6% và 2,8%. Vào đầu tháng 6, một cuộc khảo sát của Morgan Stanley cho thấy chỉ 19% số người được hỏi cho biết họ đã sử dụng ChatGPT và chỉ 4% cho biết họ dựa vào ChatGPT.
Hou Zhenyu cho biết: "Vào tháng 3 năm nay, khi khách hàng lần đầu tiên bắt đầu nói chuyện với chúng tôi về nhu cầu của các mô hình quy mô lớn, tất cả họ đều sử dụng trí tưởng tượng của mình, yêu cầu khoa học viễn tưởng hơn. Nhưng sau tháng 4, những hạn chế của mô hình quy mô lớn Các mô hình quy mô đã được tiết lộ và mọi người đã chậm lại. Từ từ nhìn thấy nhiều nhu cầu thực tế hơn.
**Việc thương mại hóa các mô hình lớn ở đầu To C còn chậm. ** Hiện tại, chúng ta đang phải đối mặt với các vấn đề như chi phí sức mạnh tính toán cao, quy mô người dùng càng lớn thì doanh nghiệp càng thua lỗ. Việc xuất ra “tiếng ồn” sai cũng khó tránh khỏi, thậm chí còn có những thách thức về đạo đức như rò rỉ thông tin, giám sát chính sách. Ngay cả Microsoft cũng chỉ triển khai mô hình lớn trong các sản phẩm công cụ (bộ ứng dụng văn phòng office, trình duyệt web, công cụ chỉnh sửa ảnh như Photoshop). Bản chất của việc Microsoft bán dịch vụ cho các công ty công cụ vẫn là thương mại hóa To B.
**Đó là một cách tiếp cận thực tế để triển khai các mô hình lớn cho khách hàng doanh nghiệp cấp B. **Trong thị trường công nghiệp, nhu cầu của khách hàng rất mạnh mẽ và rõ ràng. Trên khắp thế giới, bán lẻ, tài chính, sản xuất, chính phủ và các lĩnh vực khác đang dựa vào các mô hình lớn để nâng cấp thông minh. Sự đồng thuận trong ngành là một mô hình đã được tinh chỉnh dựa trên kiến thức ngành trên cơ sở một mô hình lớn sẽ hoạt động tốt hơn một mô hình lớn có mục đích chung chưa được tối ưu hóa.
Theo dữ liệu do công ty nghiên cứu thị trường IDC công bố vào tháng 5 năm nay, tổng quy mô thị trường trí tuệ nhân tạo của Trung Quốc vào năm 2022 sẽ là 12,2 tỷ USD, bao gồm 8,13 tỷ USD cho phần cứng, 2,69 tỷ USD cho phần mềm và 1,41 tỷ USD cho dịch vụ. IDC dự đoán rằng vào năm 2026, thị trường trí tuệ nhân tạo của Trung Quốc sẽ đạt 26,9 tỷ USD, bao gồm 14,85 tỷ USD cho phần cứng, 7,69 tỷ USD cho phần mềm và 3,89 tỷ USD cho dịch vụ. Tốc độ tăng trưởng kép hàng năm của phần cứng, phần mềm và dịch vụ lần lượt là 15,1%, 32,0% và 28,5%.
Cuồng tín bao giờ cũng trở về với thực tế. Vào tháng 6, "Tài chính" đã tổ chức một cuộc đối thoại với Hou Zhenyu, phó chủ tịch của Tập đoàn Baidu và Zhu Yong, phó chủ tịch của Baidu Smart Cloud, với chủ đề "Trung Quốc thực sự cần loại mô hình nào?" Hou Zhenyu và Zhu Yong đã tham gia sâu vào Baidu Wenxin Qianfan Trong cuộc trò chuyện này, chúng tôi đã thảo luận về ba vấn đề chính: tạo ra một nền tảng mô hình và định hình hệ sinh thái thương mại: Mô hình lớn có phải là trò chơi xa xỉ không? Doanh nghiệp cần loại mô hình lớn nào? Liệu có bong bóng trong thị trường người mẫu lớn?
Hồ sơ người đối thoại:
Hou Zhenyu, phó chủ tịch Tập đoàn Baidu (phụ trách nhóm nghiên cứu sản xuất điện toán đám mây và nhóm kỹ sư công nghệ cơ bản của Nhóm kinh doanh đám mây thông minh Baidu)
Zhu Yong, Phó chủ tịch Baidu Smart Cloud (phụ trách Trung tâm sản phẩm ứng dụng Baidu Smart Cloud)
Người dẫn chương trình: Xie Lirong, Phó Tổng biên tập Tạp chí Caijing
Sau đây là phiên bản cô đọng của bản ghi đối thoại:
**Mô hình lớn có phải là cuộc chơi xa xỉ? **
** "Tài chính" Xie Lirong: Trung Quốc đã khơi dậy làn sóng khởi nghiệp quy mô lớn và ngưỡng cho các mô hình quy mô lớn là rất cao, nhưng tình hình hiện tại của thị trường Trung Quốc dường như không phải như vậy về mặt tốc độ và quy mô gia nhập? **
Zhu Yong: Ngưỡng cho các mô hình lớn là tương đối và sẽ có các loại người chơi khác nhau. Loại đầu tiên giống như Baidu, tạo ra một mô hình lớn cơ bản từ đầu. Điều này có yêu cầu rất cao về sức mạnh tính toán, thuật toán, dữ liệu và tài năng.
Lấy dữ liệu làm ví dụ, mô hình lớn cơ bản yêu cầu đào tạo dữ liệu lớn, bao gồm dữ liệu Internet, dữ liệu lĩnh vực chuyên môn, dữ liệu thông tin tin tức và dữ liệu được dán nhãn chuyên nghiệp chất lượng cao. Lấy sức mạnh tính toán làm ví dụ, một mô hình lớn với hàng trăm tỷ tham số như ChatGPT cần được đào tạo liên tục trong 100 ngày với GPU A100/H100 cao cấp nhất của NVIDIA. Thuật toán và tài năng cũng là chìa khóa. Các kỹ sư có các phương pháp đào tạo khác nhau, cũng như các đầu bếp khác nhau chế biến các món ăn có hương vị khác nhau dựa trên cùng một loại nguyên liệu. Điều này đòi hỏi sự tích lũy kinh nghiệm thực tế lâu dài nên ngưỡng rất cao.
Loại thứ hai là mô hình công nghiệp lớn, đòi hỏi một số tinh chỉnh và tùy chỉnh có mục tiêu dựa trên khả năng của mô hình lớn cơ bản. Chi phí này thấp hơn nhiều so với chi phí ghi nhãn dữ liệu và tinh chỉnh thuật toán từ đầu trong quá khứ. Loại thứ ba phát triển các ứng dụng dựa trên hai mô hình lớn đầu tiên.Baidu, các công ty khác và thậm chí một số nền tảng nguồn mở cung cấp các công cụ phát triển để hạ thấp ngưỡng phát triển phần mềm.
** "Nhà tài phiệt" Xie Lirong: Đẳng cấp của người mẫu cỡ lớn Trung Quốc trên thị trường toàn cầu là gì? **
**Hou Zhenyu:**Cá nhân tôi nghĩ rằng các mô hình quy mô lớn của Trung Quốc vẫn đang dẫn đầu trên thị trường toàn cầu. Phát triển mô hình quy mô lớn và phát triển công cụ tìm kiếm thực sự tương tự nhau và cả hai đều yêu cầu tích lũy kỹ thuật rất sâu. Từ góc độ toàn cầu, chỉ có một số quốc gia có nghiên cứu và phát triển độc lập về công nghệ công cụ tìm kiếm. Hiện tại, Trung Quốc và Hoa Kỳ có thể là hai quốc gia duy nhất có thể hoàn toàn độc lập phát triển công nghệ mô hình quy mô lớn.
** "Tài chính" Xie Lirong: Có tiến bộ và lạc hậu tuyệt đối trong các mô hình lớn? **
**Hou Zhenyu: **Mô hình lớn không hoàn toàn tốt hay xấu. Mặc dù nó có thể có sự khác biệt nhất định trong các lĩnh vực khác nhau, nhưng nó giống như việc chọn một chiếc điện thoại thông minh. Có người dùng Apple, có người dùng Android, cái nào phù hợp nhất là tốt nhất. Khi mô hình lớn lần đầu tiên được ra mắt, mọi người thường hỏi một số câu hỏi hóc búa về nó. Nhưng trên thực tế, trong một môi trường cấp doanh nghiệp thực sự nghiêm túc, có rất ít kịch bản như vậy. Các doanh nghiệp cần chọn một mô hình lớn phù hợp hơn với họ theo kịch bản kinh doanh của họ. Đặc biệt, các công ty Trung Quốc cần chọn những sản phẩm hiểu rõ hơn về tiếng Trung và phù hợp với đặc điểm của các công ty Trung Quốc.
** "Nhà tài chính" Xie Lirong: Baidu đã đầu tư bao nhiêu tài nguyên và nhân lực vào mô hình quy mô lớn? **
**Hou Zhenyu: **Mô hình quy mô lớn AI là chiến lược cốt lõi của Baidu, đòi hỏi đầu tư cường độ cao liên tục và toàn diện. Lấy sức mạnh tính toán làm ví dụ, việc tích lũy số lượng GPU mà chúng tôi đã tích lũy trong quá khứ được tính bằng hàng chục nghìn, đây là một khoản đầu tư rất lớn. Baidu cũng đã phát triển một bộ chuỗi công cụ hoàn chỉnh trong nhiều năm để đào tạo các mô hình nhanh hơn và tốt hơn.
Trong 10 năm qua, Baidu đã đầu tư hơn 100 tỷ nhân dân tệ vào AI. Là một công ty công nghệ, Baidu dành hơn 20% doanh thu cho R&D hàng năm. (Lưu ý: Sau năm 2019, chi tiêu cốt lõi cho R&D của Baidu chiếm hơn 20% doanh thu trong một thời gian dài. Vào năm 2022, tỷ lệ chi tiêu cho R&D của Baidu là 24%, chỉ đứng sau 25% của Huawei trong số các công ty công nghệ Trung Quốc. Baidu cốt lõi đề cập đến việc loại trừ Aiqi Baidu có công việc kinh doanh riêng sau nghệ thuật), nhưng mô hình lớn không đơn giản như đầu tư một khoản tiền để làm mô hình, nó đòi hỏi sức mạnh tính toán, dữ liệu và các kỹ sư AI có kinh nghiệm phải tích lũy lâu dài mới thành công. nền tảng R&D.
**"Tài chính" Xie Lirong: Ngoài tiền, thẻ và dữ liệu, những thách thức đối với một công ty mới thành lập để tạo ra một mô hình quy mô lớn cơ bản là gì? **
**Hou Zhenyu: **Bản thân tiền, thẻ và dữ liệu đã rất khó khăn. Các công ty khởi nghiệp làm mô hình quy mô lớn cơ bản, ngoài sức mạnh tính toán tối thiểu, dữ liệu đầy đủ và chất lượng cao, nhân sự R&D AI có kinh nghiệm, họ còn cần một nền tảng phát triển AI có thể quản lý tốt các mô hình và sức mạnh tính toán. Hiện tại, các công ty lớn sẽ sử dụng các nền tảng này để cung cấp các dịch vụ bên ngoài dưới dạng đám mây. Ví dụ: Baidu Smart Cloud cung cấp các dịch vụ bên ngoài thông qua nền tảng mô hình quy mô lớn Wenxin Qianfan. Tuy nhiên, ngưỡng để đào tạo một mô hình lớn cơ bản từ đầu vẫn còn rất cao. Bởi vì mô hình lớn là không đủ để được đào tạo, nhưng cũng đòi hỏi phải lặp đi lặp lại nhanh nhẹn liên tục, và các công ty lớn sẽ tương đối trưởng thành hơn.
** "Tài chính" Xie Lirong: Một số công ty đang bắt đầu xây dựng các mô hình lớn của riêng họ. Có nhất thiết phải tự mình xây dựng một mô hình lớn? Khi đám mây công cộng mới xuất hiện vào năm 2014, một số khách hàng đã lo lắng về vấn đề bảo mật dữ liệu, liệu họ có lo lắng về vấn đề này khi sử dụng các mô hình lớn không? **
**Hou Zhenyu:**Mọi công ty đều phải sử dụng mô hình quy mô lớn, nhưng có phải doanh nghiệp nào cũng cần tự mình làm mô hình quy mô lớn không? Tôi không nghĩ vậy. Rất tốn kém để tự làm một mô hình lớn cơ bản từ đầu. Các doanh nghiệp có thể sử dụng dữ liệu của chính họ để tinh chỉnh các mô hình cơ bản của người khác và họ cũng có thể đạt được kết quả rất tốt.
Zhu Yong: Tôi nghĩ các doanh nghiệp nên suy nghĩ nhiều hơn về cách sử dụng các mô hình lớn và cách tận dụng tốt các mô hình lớn. Mỗi doanh nghiệp có thể có mô hình mẫu của riêng mình nhưng không cần phải bắt đầu lại. Bởi vì các công ty như Baidu đã cung cấp một nền tảng kỹ thuật tốt. Bạn có thể dựa vào Baidu để tạo ra một số sản phẩm tùy chỉnh, đây là lựa chọn hiệu quả hơn về chi phí cho khách hàng. Vấn đề bảo mật dữ liệu không phải là một vấn đề mới do sự xuất hiện của các mô hình lớn. Nếu so với điện toán đám mây thì có public cloud, private cloud, hosting, v.v. Trong mô hình kinh doanh quy mô lớn, chúng tôi đã xem xét đầy đủ các sản phẩm và giải pháp tương ứng.
** "Tài chính" Xie Lirong: Sự phổ biến của điện thoại thông minh và đám mây là do giá rẻ. Khi nào mô hình lớn của Trung Quốc sẽ bước vào giai đoạn áp dụng chung? **
Hou Zhenyu: Bản thân mô hình lớn đã giúp tiết kiệm rất nhiều chi phí. Trước đây, khi các doanh nghiệp phát triển các ứng dụng AI, họ cần làm sạch dữ liệu, ghi nhãn, đào tạo mô hình, lập luận và tối ưu hóa theo các kịch bản ứng dụng. Cho dù cảnh nhỏ đến đâu, toàn bộ quá trình phải được thực hiện và chi phí rất cao. Nhưng dựa trên mô hình lớn, không cần nhiều dữ liệu, thời gian, tài nguyên và nhân lực như trước đây. Tôi đề nghị các doanh nghiệp nên quan tâm và sử dụng công nghệ mô hình quy mô lớn càng sớm càng tốt, bởi vì nó có thể giảm đáng kể ngưỡng ứng dụng AI.
**Các công ty Trung Quốc cần những mô hình lớn nào? **
** "Tài chính" Xie Lirong: Mô hình quy mô lớn Wenxin của Baidu đã bắt đầu thử nghiệm nội bộ vào tháng Ba. Trong quá trình thử nghiệm nội bộ, doanh nghiệp có thể đưa ra rõ ràng nhu cầu của mình không? Nhu cầu của họ tập trung ở đâu? **
**Zhu Yong:**Kể từ khi thử nghiệm nội bộ vào tháng 3, chúng tôi đã liên tục nhận được yêu cầu truy cập từ hơn 150.000 khách hàng. Đồng thời, hàng trăm đối tác đang tiến hành các thử nghiệm nghiên cứu và phát triển với chúng tôi tại hiện trường. Điều này bao gồm các ngành công nghiệp khác nhau như Internet, sản xuất và tài chính, và nhiều kịch bản trong đó có giá trị cao. Tóm lại, có một số loại kịch bản có tần suất cao—quản lý tri thức, tạo nội dung (bao gồm viết quảng cáo tiếp thị, thông tin truyền thông), dịch vụ khách hàng thông minh, tạo mã và cải thiện hiệu quả văn phòng.
** "Nhà tài phiệt" Xie Lirong: Có một vấn đề đã tồn tại từ lâu trong thị trường chuyển đổi kỹ thuật số, đó là nhiều khách hàng không biết họ muốn gì. Trong lĩnh vực người mẫu lớn, phải chăng cũng tồn tại sự mâu thuẫn này? **
**Zhu Yong: **Thực sự có sự khác biệt giữa các ngành công nghiệp khác nhau và các khách hàng khác nhau. Sau khi mô hình lớn ra mắt, ngành công nghiệp Internet đã chú ý đến những phát triển mới nhất của nó. Sự hiểu biết về kỹ thuật và nhận thức về sản phẩm của họ rất tiên tiến, vì vậy chúng tôi có thể nhanh chóng thực hiện các thử nghiệm nghiên cứu và phát triển cùng nhau, đồng thời tạo ra các bản demo và đổi mới sản phẩm.
Nền tảng kỹ thuật số của một số ngành công nghiệp truyền thống tương đối yếu, vì vậy Baidu sẽ có một số lượng lớn kỹ sư để cùng sáng tạo với khách hàng, kết hợp khả năng AI với các điểm yếu trong ngành của họ và tạo ra nhiều khái niệm sản phẩm rất mới lạ. Khi công nghệ AI được kết hợp với ngành, một mặt cần phải hiểu công nghệ và AI, mặt khác phải hiểu ngành. Vì vậy, khi kết nối với khách hàng, đối tác, chúng tôi thường cần cả hai bên cùng sáng tạo.
** "Nhà tài chính" Xie Lirong: Baidu cung cấp dịch vụ mô hình quy mô lớn cho các ngành khác nhau và các loại khách hàng khác nhau như thế nào? Làm thế nào để đánh giá hiệu suất chi phí từ quan điểm của khách hàng? **
Zhu Yong: Về giá cả, nếu doanh nghiệp chỉ dùng thử và nhạy cảm với giá cả thì có thể sử dụng dịch vụ đám mây công cộng. Theo số lượng cuộc gọi, Pay-as-you-go (dùng bao nhiêu cũng được). ) không yêu cầu cơ sở một lần Đầu tư vào cơ sở vật chất cũng là một lợi thế của đám mây công cộng. Một số công ty sẵn sàng đầu tư lớn vào cơ sở hạ tầng và xây dựng các ứng dụng thông minh của riêng họ, Baidu có thể cung cấp một bộ hoàn chỉnh các mô hình AI và cơ sở AI, và các công ty có thể phát triển các ứng dụng dựa trên các mô hình AI và cơ sở AI.
** "Tài chính" Xie Lirong: Làm thế nào để các công ty chọn một mô hình lớn phù hợp với họ? **
Hou Zhenyu: Đầu tiên phải là hiệu ứng mô hình, đây là cơ sở để chọn mô hình lớn. Doanh nghiệp cần đánh giá giá trị mà các mô hình lớn có thể mang lại trong các tình huống sử dụng. Thứ hai, tập trung vào tốc độ lặp. Nó không chỉ phụ thuộc vào việc bản thân mô hình lớn cơ bản có sức sống hay không mà còn phụ thuộc vào việc nền tảng có chuỗi công cụ hoàn chỉnh hay không, hỗ trợ phát triển thứ cấp thuận tiện và đào tạo lại mô hình cũng như hỗ trợ lặp lại các mô hình lớn tốt hơn hay không. Thứ ba, chi phí hạ cánh thực tế và hình thức giao hàng của mô hình lớn. Doanh nghiệp có thể lựa chọn chế độ phân phối public cloud và private cloud tùy theo nhu cầu của mình.
** "Tài chính" Xie Lirong: Wenxin Qianfan được định vị là nền tảng mô hình quy mô lớn cấp doanh nghiệp một cửa, hiểu "một cửa" và "cấp doanh nghiệp" như thế nào? **
Hou Zhenyu: Trước hết, "một cửa", AI là một công nghệ được điều khiển bởi dữ liệu. Ngay từ khi mới ra đời, AI cần thu thập, dọn dẹp và gắn nhãn dữ liệu, sau đó tiến hành đào tạo dựa trên các mô hình hiện có, sau khi đào tạo, nó cần quản lý các phiên bản mô hình và dữ liệu đã tinh chỉnh, cuối cùng là đưa chúng vào sử dụng trong kinh doanh . Đó là cả một quá trình. Baidu cung cấp những khả năng này và nó rất dễ sử dụng, có thể đáp ứng nhu cầu của khách hàng trong toàn bộ vòng đời từ nghiên cứu và phát triển AI đến ứng dụng.
Bên cạnh "cấp doanh nghiệp", các ứng dụng cấp doanh nghiệp không phải là ứng dụng cá nhân, không đơn giản như tải ảnh lên. Các ứng dụng cấp doanh nghiệp sẽ tinh tế và phức tạp hơn, đồng thời các yếu tố như quy mô, khả năng mở rộng, chi phí triển khai cũng như tính ổn định và mạnh mẽ cần được xem xét.
** "Tài chính" Xie Lirong: Theo Baidu, nền tảng mô hình quy mô lớn Wenxin Qianfan có sáu đặc điểm - dễ sử dụng, an toàn, toàn diện, hiệu quả, cởi mở và tích hợp. Tại sao tính dễ sử dụng nên được ưu tiên hàng đầu? Có đúng là chỉ những công nghệ hữu ích mới được phổ biến? **
**Hou Zhenyu: **Tính dễ sử dụng rất quan trọng. Mô hình lớn ngôn ngữ tự nhiên có thể cung cấp cho khách hàng giao diện dễ sử dụng hơn, thuận tiện cho mọi người tương tác với máy. "Tích hợp đám mây và trí thông minh, tính toàn diện của AI" là chiến lược của Baidu Smart Cloud và "tính toàn diện của AI" luôn là một trong những lý tưởng của chúng tôi. AI không thể chỉ là một công nghệ đỉnh cao trong tháp ngà mà phải hạ thấp ngưỡng sử dụng AI, bao gồm cả ngưỡng sử dụng dữ liệu, sử dụng tài nguyên và sử dụng AI của con người, vì vậy tính dễ sử dụng là rất quan trọng.
**"Tài chính" Xie Lirong: Trong ba tháng qua, công chúng đã được phổ biến rộng rãi với các mô hình trí tuệ nhân tạo. Đối với hàng ngàn ngành công nghiệp, cơ hội thương mại cho các mô hình lớn đã đến chưa? Nhịp điệu kinh doanh tốt nên như thế nào? **
**Zhu Yong:**Mô hình trí tuệ nhân tạo lớn có những thay đổi rất rõ ràng trong mô hình R&D và ứng dụng. Bạn càng nắm bắt và hiểu mô hình lớn càng sớm thì nó sẽ càng có nhiều tác động đến doanh nghiệp. Đây không phải là câu hỏi có hay không. Khi nói đến tốc độ, các công ty khác nhau nắm bắt các mô hình lớn theo những cách khác nhau. Một số doanh nghiệp có thể bắt đầu từ bản dùng thử ứng dụng một điểm và sử dụng đám mây công cộng để gọi dịch vụ, nhờ đó họ có thể nhanh chóng xác minh và phát triển bản demo với chi phí thấp hơn.
Mặt khác, dù là doanh nghiệp lớn hay nhỏ, đều cần trau dồi tư duy AI native. Ví dụ, một số ứng dụng có thể được chuyển đổi và nâng cấp dần dần. Một cách tiếp cận khác được gọi là tái cấu trúc, theo tuyên bố nội bộ của Baidu, tất cả các sản phẩm trong tương lai sẽ được làm lại dựa trên mô hình lớn.
** Có bong bóng trong thị trường mô hình lớn? **
** "Tài chính" Xie Lirong: Bạn có thực sự cần nhiều người mẫu lớn như vậy trong thị trường B-end định hướng kinh doanh không? **
**Hou Zhenyu:**Ý kiến cá nhân của tôi là mô hình lớn cơ bản không cần nhiều như vậy. Tất nhiên, đây chỉ là mong đợi từ cuối. Nhưng trong giai đoạn đầu phát triển của bất kỳ ngành nào, thị trường trở nên thịnh vượng và sôi nổi. Từ góc độ phát triển công nghiệp, chúng ta nên cho phép một số bong bóng ngay bây giờ. Chúng ta cũng nên đối mặt với điều này. Nhưng tôi vẫn tin rằng sau khi sóng lớn cuốn trôi cát, cuối cùng vẫn là một vài công ty cung cấp các dịch vụ mô hình cơ bản.
** Zhu Yong: ** Theo hướng mô hình lớn cơ bản, mặc dù hiện tại có nhiều người chơi, nhưng thực sự rất khó để duy trì quá trình lặp lại nhanh chóng, liên tục phát triển chuỗi công cụ toàn diện và hoàn thiện hơn, đồng thời liên tục cải thiện khả năng của sản phẩm dựa trên khách hàng điều phản hồi. Do đó, mặc dù mô hình lớn hiện có thể rất nóng, nhưng đó là một cuộc đua đường dài, cuối cùng, nó sẽ giống như bối cảnh điện toán đám mây ngày nay, và thị trường sẽ dần dần hội tụ.
** "Tài chính" Xie Lirong: Nhiều công ty sản xuất phần cứng máy chủ cũng muốn sản xuất mô hình công nghiệp quy mô lớn. Baidu từng là khách hàng của họ, nhưng giờ họ đang cạnh tranh với nhau. Chúng ta nên chung sống hòa bình với nhau như thế nào? **
Hou Zhenyu: Tôi không nghĩ chúng ta có thể trực tiếp nói về cạnh tranh, trước hết chúng ta vẫn là quan hệ hợp tác. Hai bên thực sự sẽ có các dịch vụ tương tự và đối mặt với các ngành công nghiệp tương tự cùng một lúc, nhưng chúng tôi và các nhà sản xuất phần cứng truyền thống bổ sung cho nhau nhiều hơn. Baidu là một công ty trí tuệ nhân tạo có gen Internet, đã tích lũy được một lượng lớn dữ liệu đa năng và một mô hình lớn đa năng, lợi thế của nó nằm ở trí tuệ nhân tạo, phần mềm, công nghệ và các lĩnh vực khác. Các nhà sản xuất phần cứng truyền thống đã tích lũy dữ liệu ngành và phát triển Bí quyết trong các lĩnh vực dọc như các ngành công nghiệp của chính phủ và doanh nghiệp truyền thống. Hai bên có thế mạnh khác nhau trong việc xây dựng mô hình lớn. Các doanh nghiệp như Baidu và H3C không chỉ là đối tác mua máy chủ và thiết bị chuyển mạch mà còn cùng nhau xây dựng các mô hình lớn.
** "Tài chính" Xie Lirong: Baidu thường chú ý đến tiến độ của các mô hình lớn của đối thủ cạnh tranh? **
Zhu Yong: Thứ nhất, công nghệ và hiệu ứng tổng thể. Thứ hai, công cụ hỗ trợ. Thứ ba, mô hình kinh doanh. Nếu bạn quay lại ba hoặc bốn năm trước, thị trường trí tuệ nhân tạo vẫn còn tương đối xa, nhưng ngày nay công nghệ học sâu, thương mại hóa sản phẩm, đầu tư và hệ sinh thái nguồn mở đều đang tăng tốc.
** "Nhà tài chính" Xie Lirong: Trong vài năm tới, các mô hình quy mô lớn sẽ là hướng đi cốt lõi của Baidu? Tại sao? **
**Hou Zhenyu: **Các mô hình lớn sẽ là trọng tâm cốt lõi của Baidu. Baidu là một công ty AI, và các mô hình lớn là một hướng phát triển quan trọng của AI. Cho dù đó là phía To C hay phía To B, nó sẽ mang lại những thay đổi to lớn cho các sản phẩm và dịch vụ của Baidu. Đối với Baidu, các mô hình lớn rất thú vị, đó vừa là cơ hội vừa là thách thức. Baidu sẽ tiếp tục đầu tư vào các mô hình lớn. Tôi tin rằng các mô hình lớn sẽ đẩy nhanh điện toán đám mây vào kỷ nguyên AI và định hình lại bối cảnh điện toán đám mây. Trạng thái của MaaS (Mô hình dưới dạng Dịch vụ) sẽ ngày càng trở nên quan trọng hơn và nó cũng sẽ đẩy nhanh việc hiện thực hóa Baidu Chiến lược "tích hợp đám mây và trí thông minh" và lý tưởng về "tính toàn diện AI" do Smart Cloud đề xuất.
** "Tài chính" Xie Lirong: Vòng thương mại hóa trí tuệ nhân tạo cuối cùng bắt đầu vào năm 2016 đã gặp một số vấn đề và các công ty AI phải thực hiện rất nhiều dự án tùy chỉnh chi tiết và tẻ nhạt. Làm thế nào các mô hình lớn có thể tránh được các vấn đề gặp phải trong đợt thương mại hóa trí tuệ nhân tạo vừa qua? **
Hou Zhenyu: Đợt đổ bộ ngành mô hình quy mô lớn này khác với ngành AI được đại diện bởi deep learning mười năm trước. Đây là một mô hình mới cho nghiên cứu và phát triển AI, khác với các khoản đầu tư trước đây. Trước khi xuất hiện các mô hình quy mô lớn, AI bị chỉ trích nhiều nhất và khó triển khai nhất là môi trường công nghiệp thực tế bị phân mảnh. Ví dụ: nhận dạng khuôn mặt của cổng và nhận dạng khuôn mặt khi thanh toán là khác nhau. Vì ánh sáng và môi trường khác nhau nên nó cần được định hướng cho các ứng dụng khác nhau và việc đào tạo phải được thực hiện từ đầu theo dữ liệu tích lũy của khách hàng, sau đó điều chỉnh cho phù hợp với hiện trường. Loại giao hàng tùy chỉnh này rất cồng kềnh.
Nhưng theo mô hình lớn cơ bản, có thể thu được kết quả rất tốt mà không cần quá nhiều dữ liệu tinh chỉnh và không cần quá nhiều vòng huấn luyện. Các mô hình cơ sở lớn giải quyết nhiều tình huống dễ dàng hơn nhiều so với trước đây. Khả năng khái quát hóa của các mô hình lớn mạnh hơn trước rất nhiều. Điều này khác với vòng hạ cánh AI cuối cùng. Năm ngoái, một mô hình có 1 tỷ tham số được gọi là mô hình lớn, nhưng bây giờ các tham số mô hình thường là hàng trăm tỷ. Với hơn 100 tỷ tham số, trí thông minh sẽ xuất hiện, khả năng khái quát hóa mạnh mẽ hơn và khả năng chung trong các tình huống khác nhau.
** "Nhà tài chính" Xie Lirong: Khi nhiều người đổ tiền vào một ngành, bong bóng có thể là điều khó tránh khỏi. Nếu mô hình lớn được phát triển một cách lành mạnh, bạn có đề xuất gì? **
Hou Zhenyu: Lời khuyên của tôi dành cho những người hành nghề mô hình lớn là hãy làm những gì bạn có thể. Bạn không cần phải làm tất cả một mình. Thay vào đó, hãy xem xét việc thương mại hóa AI và tìm các kịch bản và chuỗi phù hợp nhất với khả năng của bạn. Chúng tôi hy vọng rằng khi ngành công nghiệp phát triển nhanh chóng trong giai đoạn đầu, một số bong bóng nhất định sẽ được cho phép. Tuy nhiên, chính sách có thể đạt được sự đồng thuận về giám sát ứng dụng công nghệ và các tiêu chuẩn của ngành để đánh giá chất lượng công nghệ. Có những tiêu chuẩn để tuân theo và các quy tắc để tuân theo, để chúng ta có thể phát triển một cách lành mạnh.
Zhu Yong: Chúng ta cũng cần thay đổi cách suy nghĩ. Mô hình lớn là công nghệ đầu nguồn, công nghệ lật đổ. Giữ một tâm trí cởi mở và tiếp tục học hỏi.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Đối thoại | 79 mô hình quy mô lớn cơ bản ra đời trong ba tháng, Trung Quốc cần loại mô hình quy mô lớn nào?
Văn bản: Wu Junyu Biên tập: Xie Lirong
Nguồn: Tài chính Eleven
Sau khi ChatGPT được phát hành vào cuối năm ngoái, các công ty Trung Quốc đã phát hành ít nhất 79 mẫu lớn cơ bản. Tuy nhiên, hầu hết các mô hình lớn được thế giới bên ngoài coi là có khoảng cách kỹ thuật với ChatGPT. Sắp có mô hình kinh doanh quy mô lớn, Trung Quốc cần loại mô hình quy mô lớn nào?
Vào tháng 12 năm 2022, OpenAI, một công ty khởi nghiệp về AI do Microsoft đầu tư, đã ra mắt AI ChatGPT đàm thoại. ChatGPT thực chất là một mô hình lớn bằng ngôn ngữ GPT do OpenAI phát triển độc lập, chứa gần 180 tỷ tham số. Vào tháng 2 năm nay, Giám đốc điều hành Nvidia Huang Renxun đã nhận xét rằng "ChatGPT đã mở ra thời điểm iPhone cho AI". Huang Renxun tin rằng các mô hình lớn đang hạ thấp ngưỡng phát triển ứng dụng và tất cả các ứng dụng đều đáng để làm lại với các mô hình lớn.
Đây không phải là lời của gia đình Huang Renxun, mọi người đều nhìn thấy cơ hội. Bắt đầu từ tháng 3 năm nay, các công ty Trung Quốc cũng đua nhau tung ra các sản phẩm mô hình quy mô lớn. Chúng bao gồm các công ty hàng đầu, chẳng hạn như mô hình Wenxin của Baidu, mô hình Tongyi của Ali và mô hình công nghiệp của Tencent, cũng như các công ty công nghiệp như Xunfei và SenseTime, cũng như một số công ty mới thành lập. Vào tháng 5, Viện Thông tin Khoa học và Công nghệ Trung Quốc thuộc Bộ Khoa học và Công nghệ đã công bố "Báo cáo nghiên cứu về Bản đồ mô hình lớn trí tuệ nhân tạo của Trung Quốc". Theo báo cáo, tính đến ngày 28 tháng 5, ít nhất 79 mô hình quy mô lớn cơ bản với thông số trên 1 tỷ đã được phát hành tại Trung Quốc.
**Mặc dù các mô hình AI hiện đang được tung ra thị trường đều được gọi là "mô hình lớn", nhưng số lượng tham số được mặc định coi là một trong những yếu tố quyết định mô hình lớn và mô hình nhỏ. ** Hou Zhenyu, phó chủ tịch của Tập đoàn Baidu, nói với phóng viên Caijing rằng một mô hình có 1 tỷ tham số vào năm 2022 được gọi là mô hình lớn. Nhưng các thông số mô hình lớn hiện nay thường là hàng trăm tỷ. Bởi vì hiệu ứng "sự xuất hiện thông minh" sẽ xuất hiện với hơn 100 tỷ tham số, khả năng khái quát hóa sẽ được hình thành và khả năng phổ quát trong các tình huống khác nhau sẽ được hình thành. Mô hình tinh chỉnh dựa trên mô hình lớn này có hiệu ứng ứng dụng công nghiệp tốt hơn.
**Hiệu ứng "sự xuất hiện thông minh" đề cập đến thực tế là sau khi quy mô mô hình và mức năng lượng tính toán vượt quá một ngưỡng tham số nhất định, hiệu ứng AI sẽ không còn là sự kiện xác suất ngẫu nhiên nữa. **Trong lĩnh vực chung, số lượng tham số càng nhiều thì khả năng xuất hiện trí thông minh nói chung càng lớn và độ chính xác của AI càng cao. Trong trường dọc chuyên dụng, việc thu được kết quả chính xác sẽ dễ dàng hơn sau khi mô hình tham số lớn được cắt và tối ưu hóa.
Mặc dù ít nhất 79 mô hình quy mô lớn đã xuất hiện ở Trung Quốc, nhưng nhiều chuyên gia trong ngành được Caijing phỏng vấn tin rằng các mô hình quy mô lớn đòi hỏi sức mạnh tính toán, thuật toán và tích lũy dữ liệu. Do thiếu chip GPU hiệu suất cao, chi phí mua sắm phần cứng cao và chi phí vận hành cao, có rất ít công ty ở Trung Quốc có dự trữ vốn, ý chí chiến lược và năng lực thực tế để thực hiện thương mại hóa các mô hình lớn. Trong "Cuộc chiến trăm kiểu", thực sự có một khoảng cách giữa hầu hết các sản phẩm và ChatGPT.
Sau sự náo động, cơn sốt người mẫu lớn đang dần trở lại với thực tế. Tư duy hợp lý hơn đang xuất hiện trên thị trường mô hình quy mô lớn trong và ngoài nước-ChatGPT không thể thương mại hóa chỉ có thể là một món đồ chơi và một mô hình quy mô lớn có thể trở thành một ứng dụng doanh nghiệp có giá trị công nghiệp.
Các công ty như Apple, Samsung và JPMorgan Chase đã cấm nhân viên sử dụng ChatGPT do lo ngại về bảo mật. Mặt khác, tốc độ tăng trưởng và giữ chân người dùng ChatGPT cũng đã đạt đến điểm nghẽn. Theo dữ liệu từ công cụ phân tích website SimilarWeb, tốc độ tăng trưởng lưu lượng truy cập của ChatGPT từ tháng 1 đến tháng 5 là 131,6%, 62,5%, 55,8%, 12,6% và 2,8%. Vào đầu tháng 6, một cuộc khảo sát của Morgan Stanley cho thấy chỉ 19% số người được hỏi cho biết họ đã sử dụng ChatGPT và chỉ 4% cho biết họ dựa vào ChatGPT.
Hou Zhenyu cho biết: "Vào tháng 3 năm nay, khi khách hàng lần đầu tiên bắt đầu nói chuyện với chúng tôi về nhu cầu của các mô hình quy mô lớn, tất cả họ đều sử dụng trí tưởng tượng của mình, yêu cầu khoa học viễn tưởng hơn. Nhưng sau tháng 4, những hạn chế của mô hình quy mô lớn Các mô hình quy mô đã được tiết lộ và mọi người đã chậm lại. Từ từ nhìn thấy nhiều nhu cầu thực tế hơn.
**Việc thương mại hóa các mô hình lớn ở đầu To C còn chậm. ** Hiện tại, chúng ta đang phải đối mặt với các vấn đề như chi phí sức mạnh tính toán cao, quy mô người dùng càng lớn thì doanh nghiệp càng thua lỗ. Việc xuất ra “tiếng ồn” sai cũng khó tránh khỏi, thậm chí còn có những thách thức về đạo đức như rò rỉ thông tin, giám sát chính sách. Ngay cả Microsoft cũng chỉ triển khai mô hình lớn trong các sản phẩm công cụ (bộ ứng dụng văn phòng office, trình duyệt web, công cụ chỉnh sửa ảnh như Photoshop). Bản chất của việc Microsoft bán dịch vụ cho các công ty công cụ vẫn là thương mại hóa To B.
**Đó là một cách tiếp cận thực tế để triển khai các mô hình lớn cho khách hàng doanh nghiệp cấp B. **Trong thị trường công nghiệp, nhu cầu của khách hàng rất mạnh mẽ và rõ ràng. Trên khắp thế giới, bán lẻ, tài chính, sản xuất, chính phủ và các lĩnh vực khác đang dựa vào các mô hình lớn để nâng cấp thông minh. Sự đồng thuận trong ngành là một mô hình đã được tinh chỉnh dựa trên kiến thức ngành trên cơ sở một mô hình lớn sẽ hoạt động tốt hơn một mô hình lớn có mục đích chung chưa được tối ưu hóa.
Theo dữ liệu do công ty nghiên cứu thị trường IDC công bố vào tháng 5 năm nay, tổng quy mô thị trường trí tuệ nhân tạo của Trung Quốc vào năm 2022 sẽ là 12,2 tỷ USD, bao gồm 8,13 tỷ USD cho phần cứng, 2,69 tỷ USD cho phần mềm và 1,41 tỷ USD cho dịch vụ. IDC dự đoán rằng vào năm 2026, thị trường trí tuệ nhân tạo của Trung Quốc sẽ đạt 26,9 tỷ USD, bao gồm 14,85 tỷ USD cho phần cứng, 7,69 tỷ USD cho phần mềm và 3,89 tỷ USD cho dịch vụ. Tốc độ tăng trưởng kép hàng năm của phần cứng, phần mềm và dịch vụ lần lượt là 15,1%, 32,0% và 28,5%.
Hồ sơ người đối thoại:
Hou Zhenyu, phó chủ tịch Tập đoàn Baidu (phụ trách nhóm nghiên cứu sản xuất điện toán đám mây và nhóm kỹ sư công nghệ cơ bản của Nhóm kinh doanh đám mây thông minh Baidu)
Zhu Yong, Phó chủ tịch Baidu Smart Cloud (phụ trách Trung tâm sản phẩm ứng dụng Baidu Smart Cloud)
Người dẫn chương trình: Xie Lirong, Phó Tổng biên tập Tạp chí Caijing
Sau đây là phiên bản cô đọng của bản ghi đối thoại:
**Mô hình lớn có phải là cuộc chơi xa xỉ? **
** "Tài chính" Xie Lirong: Trung Quốc đã khơi dậy làn sóng khởi nghiệp quy mô lớn và ngưỡng cho các mô hình quy mô lớn là rất cao, nhưng tình hình hiện tại của thị trường Trung Quốc dường như không phải như vậy về mặt tốc độ và quy mô gia nhập? **
Zhu Yong: Ngưỡng cho các mô hình lớn là tương đối và sẽ có các loại người chơi khác nhau. Loại đầu tiên giống như Baidu, tạo ra một mô hình lớn cơ bản từ đầu. Điều này có yêu cầu rất cao về sức mạnh tính toán, thuật toán, dữ liệu và tài năng.
Lấy dữ liệu làm ví dụ, mô hình lớn cơ bản yêu cầu đào tạo dữ liệu lớn, bao gồm dữ liệu Internet, dữ liệu lĩnh vực chuyên môn, dữ liệu thông tin tin tức và dữ liệu được dán nhãn chuyên nghiệp chất lượng cao. Lấy sức mạnh tính toán làm ví dụ, một mô hình lớn với hàng trăm tỷ tham số như ChatGPT cần được đào tạo liên tục trong 100 ngày với GPU A100/H100 cao cấp nhất của NVIDIA. Thuật toán và tài năng cũng là chìa khóa. Các kỹ sư có các phương pháp đào tạo khác nhau, cũng như các đầu bếp khác nhau chế biến các món ăn có hương vị khác nhau dựa trên cùng một loại nguyên liệu. Điều này đòi hỏi sự tích lũy kinh nghiệm thực tế lâu dài nên ngưỡng rất cao.
Loại thứ hai là mô hình công nghiệp lớn, đòi hỏi một số tinh chỉnh và tùy chỉnh có mục tiêu dựa trên khả năng của mô hình lớn cơ bản. Chi phí này thấp hơn nhiều so với chi phí ghi nhãn dữ liệu và tinh chỉnh thuật toán từ đầu trong quá khứ. Loại thứ ba phát triển các ứng dụng dựa trên hai mô hình lớn đầu tiên.Baidu, các công ty khác và thậm chí một số nền tảng nguồn mở cung cấp các công cụ phát triển để hạ thấp ngưỡng phát triển phần mềm.
** "Nhà tài phiệt" Xie Lirong: Đẳng cấp của người mẫu cỡ lớn Trung Quốc trên thị trường toàn cầu là gì? **
**Hou Zhenyu:**Cá nhân tôi nghĩ rằng các mô hình quy mô lớn của Trung Quốc vẫn đang dẫn đầu trên thị trường toàn cầu. Phát triển mô hình quy mô lớn và phát triển công cụ tìm kiếm thực sự tương tự nhau và cả hai đều yêu cầu tích lũy kỹ thuật rất sâu. Từ góc độ toàn cầu, chỉ có một số quốc gia có nghiên cứu và phát triển độc lập về công nghệ công cụ tìm kiếm. Hiện tại, Trung Quốc và Hoa Kỳ có thể là hai quốc gia duy nhất có thể hoàn toàn độc lập phát triển công nghệ mô hình quy mô lớn.
** "Tài chính" Xie Lirong: Có tiến bộ và lạc hậu tuyệt đối trong các mô hình lớn? **
**Hou Zhenyu: **Mô hình lớn không hoàn toàn tốt hay xấu. Mặc dù nó có thể có sự khác biệt nhất định trong các lĩnh vực khác nhau, nhưng nó giống như việc chọn một chiếc điện thoại thông minh. Có người dùng Apple, có người dùng Android, cái nào phù hợp nhất là tốt nhất. Khi mô hình lớn lần đầu tiên được ra mắt, mọi người thường hỏi một số câu hỏi hóc búa về nó. Nhưng trên thực tế, trong một môi trường cấp doanh nghiệp thực sự nghiêm túc, có rất ít kịch bản như vậy. Các doanh nghiệp cần chọn một mô hình lớn phù hợp hơn với họ theo kịch bản kinh doanh của họ. Đặc biệt, các công ty Trung Quốc cần chọn những sản phẩm hiểu rõ hơn về tiếng Trung và phù hợp với đặc điểm của các công ty Trung Quốc.
** "Nhà tài chính" Xie Lirong: Baidu đã đầu tư bao nhiêu tài nguyên và nhân lực vào mô hình quy mô lớn? **
**Hou Zhenyu: **Mô hình quy mô lớn AI là chiến lược cốt lõi của Baidu, đòi hỏi đầu tư cường độ cao liên tục và toàn diện. Lấy sức mạnh tính toán làm ví dụ, việc tích lũy số lượng GPU mà chúng tôi đã tích lũy trong quá khứ được tính bằng hàng chục nghìn, đây là một khoản đầu tư rất lớn. Baidu cũng đã phát triển một bộ chuỗi công cụ hoàn chỉnh trong nhiều năm để đào tạo các mô hình nhanh hơn và tốt hơn.
Trong 10 năm qua, Baidu đã đầu tư hơn 100 tỷ nhân dân tệ vào AI. Là một công ty công nghệ, Baidu dành hơn 20% doanh thu cho R&D hàng năm. (Lưu ý: Sau năm 2019, chi tiêu cốt lõi cho R&D của Baidu chiếm hơn 20% doanh thu trong một thời gian dài. Vào năm 2022, tỷ lệ chi tiêu cho R&D của Baidu là 24%, chỉ đứng sau 25% của Huawei trong số các công ty công nghệ Trung Quốc. Baidu cốt lõi đề cập đến việc loại trừ Aiqi Baidu có công việc kinh doanh riêng sau nghệ thuật), nhưng mô hình lớn không đơn giản như đầu tư một khoản tiền để làm mô hình, nó đòi hỏi sức mạnh tính toán, dữ liệu và các kỹ sư AI có kinh nghiệm phải tích lũy lâu dài mới thành công. nền tảng R&D.
**Hou Zhenyu: **Bản thân tiền, thẻ và dữ liệu đã rất khó khăn. Các công ty khởi nghiệp làm mô hình quy mô lớn cơ bản, ngoài sức mạnh tính toán tối thiểu, dữ liệu đầy đủ và chất lượng cao, nhân sự R&D AI có kinh nghiệm, họ còn cần một nền tảng phát triển AI có thể quản lý tốt các mô hình và sức mạnh tính toán. Hiện tại, các công ty lớn sẽ sử dụng các nền tảng này để cung cấp các dịch vụ bên ngoài dưới dạng đám mây. Ví dụ: Baidu Smart Cloud cung cấp các dịch vụ bên ngoài thông qua nền tảng mô hình quy mô lớn Wenxin Qianfan. Tuy nhiên, ngưỡng để đào tạo một mô hình lớn cơ bản từ đầu vẫn còn rất cao. Bởi vì mô hình lớn là không đủ để được đào tạo, nhưng cũng đòi hỏi phải lặp đi lặp lại nhanh nhẹn liên tục, và các công ty lớn sẽ tương đối trưởng thành hơn.
** "Tài chính" Xie Lirong: Một số công ty đang bắt đầu xây dựng các mô hình lớn của riêng họ. Có nhất thiết phải tự mình xây dựng một mô hình lớn? Khi đám mây công cộng mới xuất hiện vào năm 2014, một số khách hàng đã lo lắng về vấn đề bảo mật dữ liệu, liệu họ có lo lắng về vấn đề này khi sử dụng các mô hình lớn không? **
**Hou Zhenyu:**Mọi công ty đều phải sử dụng mô hình quy mô lớn, nhưng có phải doanh nghiệp nào cũng cần tự mình làm mô hình quy mô lớn không? Tôi không nghĩ vậy. Rất tốn kém để tự làm một mô hình lớn cơ bản từ đầu. Các doanh nghiệp có thể sử dụng dữ liệu của chính họ để tinh chỉnh các mô hình cơ bản của người khác và họ cũng có thể đạt được kết quả rất tốt.
Zhu Yong: Tôi nghĩ các doanh nghiệp nên suy nghĩ nhiều hơn về cách sử dụng các mô hình lớn và cách tận dụng tốt các mô hình lớn. Mỗi doanh nghiệp có thể có mô hình mẫu của riêng mình nhưng không cần phải bắt đầu lại. Bởi vì các công ty như Baidu đã cung cấp một nền tảng kỹ thuật tốt. Bạn có thể dựa vào Baidu để tạo ra một số sản phẩm tùy chỉnh, đây là lựa chọn hiệu quả hơn về chi phí cho khách hàng. Vấn đề bảo mật dữ liệu không phải là một vấn đề mới do sự xuất hiện của các mô hình lớn. Nếu so với điện toán đám mây thì có public cloud, private cloud, hosting, v.v. Trong mô hình kinh doanh quy mô lớn, chúng tôi đã xem xét đầy đủ các sản phẩm và giải pháp tương ứng.
** "Tài chính" Xie Lirong: Sự phổ biến của điện thoại thông minh và đám mây là do giá rẻ. Khi nào mô hình lớn của Trung Quốc sẽ bước vào giai đoạn áp dụng chung? **
Hou Zhenyu: Bản thân mô hình lớn đã giúp tiết kiệm rất nhiều chi phí. Trước đây, khi các doanh nghiệp phát triển các ứng dụng AI, họ cần làm sạch dữ liệu, ghi nhãn, đào tạo mô hình, lập luận và tối ưu hóa theo các kịch bản ứng dụng. Cho dù cảnh nhỏ đến đâu, toàn bộ quá trình phải được thực hiện và chi phí rất cao. Nhưng dựa trên mô hình lớn, không cần nhiều dữ liệu, thời gian, tài nguyên và nhân lực như trước đây. Tôi đề nghị các doanh nghiệp nên quan tâm và sử dụng công nghệ mô hình quy mô lớn càng sớm càng tốt, bởi vì nó có thể giảm đáng kể ngưỡng ứng dụng AI.
**Các công ty Trung Quốc cần những mô hình lớn nào? **
** "Tài chính" Xie Lirong: Mô hình quy mô lớn Wenxin của Baidu đã bắt đầu thử nghiệm nội bộ vào tháng Ba. Trong quá trình thử nghiệm nội bộ, doanh nghiệp có thể đưa ra rõ ràng nhu cầu của mình không? Nhu cầu của họ tập trung ở đâu? **
**Zhu Yong:**Kể từ khi thử nghiệm nội bộ vào tháng 3, chúng tôi đã liên tục nhận được yêu cầu truy cập từ hơn 150.000 khách hàng. Đồng thời, hàng trăm đối tác đang tiến hành các thử nghiệm nghiên cứu và phát triển với chúng tôi tại hiện trường. Điều này bao gồm các ngành công nghiệp khác nhau như Internet, sản xuất và tài chính, và nhiều kịch bản trong đó có giá trị cao. Tóm lại, có một số loại kịch bản có tần suất cao—quản lý tri thức, tạo nội dung (bao gồm viết quảng cáo tiếp thị, thông tin truyền thông), dịch vụ khách hàng thông minh, tạo mã và cải thiện hiệu quả văn phòng.
** "Nhà tài phiệt" Xie Lirong: Có một vấn đề đã tồn tại từ lâu trong thị trường chuyển đổi kỹ thuật số, đó là nhiều khách hàng không biết họ muốn gì. Trong lĩnh vực người mẫu lớn, phải chăng cũng tồn tại sự mâu thuẫn này? **
**Zhu Yong: **Thực sự có sự khác biệt giữa các ngành công nghiệp khác nhau và các khách hàng khác nhau. Sau khi mô hình lớn ra mắt, ngành công nghiệp Internet đã chú ý đến những phát triển mới nhất của nó. Sự hiểu biết về kỹ thuật và nhận thức về sản phẩm của họ rất tiên tiến, vì vậy chúng tôi có thể nhanh chóng thực hiện các thử nghiệm nghiên cứu và phát triển cùng nhau, đồng thời tạo ra các bản demo và đổi mới sản phẩm.
Nền tảng kỹ thuật số của một số ngành công nghiệp truyền thống tương đối yếu, vì vậy Baidu sẽ có một số lượng lớn kỹ sư để cùng sáng tạo với khách hàng, kết hợp khả năng AI với các điểm yếu trong ngành của họ và tạo ra nhiều khái niệm sản phẩm rất mới lạ. Khi công nghệ AI được kết hợp với ngành, một mặt cần phải hiểu công nghệ và AI, mặt khác phải hiểu ngành. Vì vậy, khi kết nối với khách hàng, đối tác, chúng tôi thường cần cả hai bên cùng sáng tạo.
** "Nhà tài chính" Xie Lirong: Baidu cung cấp dịch vụ mô hình quy mô lớn cho các ngành khác nhau và các loại khách hàng khác nhau như thế nào? Làm thế nào để đánh giá hiệu suất chi phí từ quan điểm của khách hàng? **
Zhu Yong: Về giá cả, nếu doanh nghiệp chỉ dùng thử và nhạy cảm với giá cả thì có thể sử dụng dịch vụ đám mây công cộng. Theo số lượng cuộc gọi, Pay-as-you-go (dùng bao nhiêu cũng được). ) không yêu cầu cơ sở một lần Đầu tư vào cơ sở vật chất cũng là một lợi thế của đám mây công cộng. Một số công ty sẵn sàng đầu tư lớn vào cơ sở hạ tầng và xây dựng các ứng dụng thông minh của riêng họ, Baidu có thể cung cấp một bộ hoàn chỉnh các mô hình AI và cơ sở AI, và các công ty có thể phát triển các ứng dụng dựa trên các mô hình AI và cơ sở AI.
** "Tài chính" Xie Lirong: Làm thế nào để các công ty chọn một mô hình lớn phù hợp với họ? **
Hou Zhenyu: Đầu tiên phải là hiệu ứng mô hình, đây là cơ sở để chọn mô hình lớn. Doanh nghiệp cần đánh giá giá trị mà các mô hình lớn có thể mang lại trong các tình huống sử dụng. Thứ hai, tập trung vào tốc độ lặp. Nó không chỉ phụ thuộc vào việc bản thân mô hình lớn cơ bản có sức sống hay không mà còn phụ thuộc vào việc nền tảng có chuỗi công cụ hoàn chỉnh hay không, hỗ trợ phát triển thứ cấp thuận tiện và đào tạo lại mô hình cũng như hỗ trợ lặp lại các mô hình lớn tốt hơn hay không. Thứ ba, chi phí hạ cánh thực tế và hình thức giao hàng của mô hình lớn. Doanh nghiệp có thể lựa chọn chế độ phân phối public cloud và private cloud tùy theo nhu cầu của mình.
** "Tài chính" Xie Lirong: Wenxin Qianfan được định vị là nền tảng mô hình quy mô lớn cấp doanh nghiệp một cửa, hiểu "một cửa" và "cấp doanh nghiệp" như thế nào? **
Hou Zhenyu: Trước hết, "một cửa", AI là một công nghệ được điều khiển bởi dữ liệu. Ngay từ khi mới ra đời, AI cần thu thập, dọn dẹp và gắn nhãn dữ liệu, sau đó tiến hành đào tạo dựa trên các mô hình hiện có, sau khi đào tạo, nó cần quản lý các phiên bản mô hình và dữ liệu đã tinh chỉnh, cuối cùng là đưa chúng vào sử dụng trong kinh doanh . Đó là cả một quá trình. Baidu cung cấp những khả năng này và nó rất dễ sử dụng, có thể đáp ứng nhu cầu của khách hàng trong toàn bộ vòng đời từ nghiên cứu và phát triển AI đến ứng dụng.
Bên cạnh "cấp doanh nghiệp", các ứng dụng cấp doanh nghiệp không phải là ứng dụng cá nhân, không đơn giản như tải ảnh lên. Các ứng dụng cấp doanh nghiệp sẽ tinh tế và phức tạp hơn, đồng thời các yếu tố như quy mô, khả năng mở rộng, chi phí triển khai cũng như tính ổn định và mạnh mẽ cần được xem xét.
** "Tài chính" Xie Lirong: Theo Baidu, nền tảng mô hình quy mô lớn Wenxin Qianfan có sáu đặc điểm - dễ sử dụng, an toàn, toàn diện, hiệu quả, cởi mở và tích hợp. Tại sao tính dễ sử dụng nên được ưu tiên hàng đầu? Có đúng là chỉ những công nghệ hữu ích mới được phổ biến? **
**Hou Zhenyu: **Tính dễ sử dụng rất quan trọng. Mô hình lớn ngôn ngữ tự nhiên có thể cung cấp cho khách hàng giao diện dễ sử dụng hơn, thuận tiện cho mọi người tương tác với máy. "Tích hợp đám mây và trí thông minh, tính toàn diện của AI" là chiến lược của Baidu Smart Cloud và "tính toàn diện của AI" luôn là một trong những lý tưởng của chúng tôi. AI không thể chỉ là một công nghệ đỉnh cao trong tháp ngà mà phải hạ thấp ngưỡng sử dụng AI, bao gồm cả ngưỡng sử dụng dữ liệu, sử dụng tài nguyên và sử dụng AI của con người, vì vậy tính dễ sử dụng là rất quan trọng.
**"Tài chính" Xie Lirong: Trong ba tháng qua, công chúng đã được phổ biến rộng rãi với các mô hình trí tuệ nhân tạo. Đối với hàng ngàn ngành công nghiệp, cơ hội thương mại cho các mô hình lớn đã đến chưa? Nhịp điệu kinh doanh tốt nên như thế nào? **
**Zhu Yong:**Mô hình trí tuệ nhân tạo lớn có những thay đổi rất rõ ràng trong mô hình R&D và ứng dụng. Bạn càng nắm bắt và hiểu mô hình lớn càng sớm thì nó sẽ càng có nhiều tác động đến doanh nghiệp. Đây không phải là câu hỏi có hay không. Khi nói đến tốc độ, các công ty khác nhau nắm bắt các mô hình lớn theo những cách khác nhau. Một số doanh nghiệp có thể bắt đầu từ bản dùng thử ứng dụng một điểm và sử dụng đám mây công cộng để gọi dịch vụ, nhờ đó họ có thể nhanh chóng xác minh và phát triển bản demo với chi phí thấp hơn.
Mặt khác, dù là doanh nghiệp lớn hay nhỏ, đều cần trau dồi tư duy AI native. Ví dụ, một số ứng dụng có thể được chuyển đổi và nâng cấp dần dần. Một cách tiếp cận khác được gọi là tái cấu trúc, theo tuyên bố nội bộ của Baidu, tất cả các sản phẩm trong tương lai sẽ được làm lại dựa trên mô hình lớn.
** Có bong bóng trong thị trường mô hình lớn? **
** "Tài chính" Xie Lirong: Bạn có thực sự cần nhiều người mẫu lớn như vậy trong thị trường B-end định hướng kinh doanh không? **
**Hou Zhenyu:**Ý kiến cá nhân của tôi là mô hình lớn cơ bản không cần nhiều như vậy. Tất nhiên, đây chỉ là mong đợi từ cuối. Nhưng trong giai đoạn đầu phát triển của bất kỳ ngành nào, thị trường trở nên thịnh vượng và sôi nổi. Từ góc độ phát triển công nghiệp, chúng ta nên cho phép một số bong bóng ngay bây giờ. Chúng ta cũng nên đối mặt với điều này. Nhưng tôi vẫn tin rằng sau khi sóng lớn cuốn trôi cát, cuối cùng vẫn là một vài công ty cung cấp các dịch vụ mô hình cơ bản.
** Zhu Yong: ** Theo hướng mô hình lớn cơ bản, mặc dù hiện tại có nhiều người chơi, nhưng thực sự rất khó để duy trì quá trình lặp lại nhanh chóng, liên tục phát triển chuỗi công cụ toàn diện và hoàn thiện hơn, đồng thời liên tục cải thiện khả năng của sản phẩm dựa trên khách hàng điều phản hồi. Do đó, mặc dù mô hình lớn hiện có thể rất nóng, nhưng đó là một cuộc đua đường dài, cuối cùng, nó sẽ giống như bối cảnh điện toán đám mây ngày nay, và thị trường sẽ dần dần hội tụ.
** "Tài chính" Xie Lirong: Nhiều công ty sản xuất phần cứng máy chủ cũng muốn sản xuất mô hình công nghiệp quy mô lớn. Baidu từng là khách hàng của họ, nhưng giờ họ đang cạnh tranh với nhau. Chúng ta nên chung sống hòa bình với nhau như thế nào? **
Hou Zhenyu: Tôi không nghĩ chúng ta có thể trực tiếp nói về cạnh tranh, trước hết chúng ta vẫn là quan hệ hợp tác. Hai bên thực sự sẽ có các dịch vụ tương tự và đối mặt với các ngành công nghiệp tương tự cùng một lúc, nhưng chúng tôi và các nhà sản xuất phần cứng truyền thống bổ sung cho nhau nhiều hơn. Baidu là một công ty trí tuệ nhân tạo có gen Internet, đã tích lũy được một lượng lớn dữ liệu đa năng và một mô hình lớn đa năng, lợi thế của nó nằm ở trí tuệ nhân tạo, phần mềm, công nghệ và các lĩnh vực khác. Các nhà sản xuất phần cứng truyền thống đã tích lũy dữ liệu ngành và phát triển Bí quyết trong các lĩnh vực dọc như các ngành công nghiệp của chính phủ và doanh nghiệp truyền thống. Hai bên có thế mạnh khác nhau trong việc xây dựng mô hình lớn. Các doanh nghiệp như Baidu và H3C không chỉ là đối tác mua máy chủ và thiết bị chuyển mạch mà còn cùng nhau xây dựng các mô hình lớn.
** "Tài chính" Xie Lirong: Baidu thường chú ý đến tiến độ của các mô hình lớn của đối thủ cạnh tranh? **
Zhu Yong: Thứ nhất, công nghệ và hiệu ứng tổng thể. Thứ hai, công cụ hỗ trợ. Thứ ba, mô hình kinh doanh. Nếu bạn quay lại ba hoặc bốn năm trước, thị trường trí tuệ nhân tạo vẫn còn tương đối xa, nhưng ngày nay công nghệ học sâu, thương mại hóa sản phẩm, đầu tư và hệ sinh thái nguồn mở đều đang tăng tốc.
** "Nhà tài chính" Xie Lirong: Trong vài năm tới, các mô hình quy mô lớn sẽ là hướng đi cốt lõi của Baidu? Tại sao? **
**Hou Zhenyu: **Các mô hình lớn sẽ là trọng tâm cốt lõi của Baidu. Baidu là một công ty AI, và các mô hình lớn là một hướng phát triển quan trọng của AI. Cho dù đó là phía To C hay phía To B, nó sẽ mang lại những thay đổi to lớn cho các sản phẩm và dịch vụ của Baidu. Đối với Baidu, các mô hình lớn rất thú vị, đó vừa là cơ hội vừa là thách thức. Baidu sẽ tiếp tục đầu tư vào các mô hình lớn. Tôi tin rằng các mô hình lớn sẽ đẩy nhanh điện toán đám mây vào kỷ nguyên AI và định hình lại bối cảnh điện toán đám mây. Trạng thái của MaaS (Mô hình dưới dạng Dịch vụ) sẽ ngày càng trở nên quan trọng hơn và nó cũng sẽ đẩy nhanh việc hiện thực hóa Baidu Chiến lược "tích hợp đám mây và trí thông minh" và lý tưởng về "tính toàn diện AI" do Smart Cloud đề xuất.
** "Tài chính" Xie Lirong: Vòng thương mại hóa trí tuệ nhân tạo cuối cùng bắt đầu vào năm 2016 đã gặp một số vấn đề và các công ty AI phải thực hiện rất nhiều dự án tùy chỉnh chi tiết và tẻ nhạt. Làm thế nào các mô hình lớn có thể tránh được các vấn đề gặp phải trong đợt thương mại hóa trí tuệ nhân tạo vừa qua? **
Hou Zhenyu: Đợt đổ bộ ngành mô hình quy mô lớn này khác với ngành AI được đại diện bởi deep learning mười năm trước. Đây là một mô hình mới cho nghiên cứu và phát triển AI, khác với các khoản đầu tư trước đây. Trước khi xuất hiện các mô hình quy mô lớn, AI bị chỉ trích nhiều nhất và khó triển khai nhất là môi trường công nghiệp thực tế bị phân mảnh. Ví dụ: nhận dạng khuôn mặt của cổng và nhận dạng khuôn mặt khi thanh toán là khác nhau. Vì ánh sáng và môi trường khác nhau nên nó cần được định hướng cho các ứng dụng khác nhau và việc đào tạo phải được thực hiện từ đầu theo dữ liệu tích lũy của khách hàng, sau đó điều chỉnh cho phù hợp với hiện trường. Loại giao hàng tùy chỉnh này rất cồng kềnh.
Nhưng theo mô hình lớn cơ bản, có thể thu được kết quả rất tốt mà không cần quá nhiều dữ liệu tinh chỉnh và không cần quá nhiều vòng huấn luyện. Các mô hình cơ sở lớn giải quyết nhiều tình huống dễ dàng hơn nhiều so với trước đây. Khả năng khái quát hóa của các mô hình lớn mạnh hơn trước rất nhiều. Điều này khác với vòng hạ cánh AI cuối cùng. Năm ngoái, một mô hình có 1 tỷ tham số được gọi là mô hình lớn, nhưng bây giờ các tham số mô hình thường là hàng trăm tỷ. Với hơn 100 tỷ tham số, trí thông minh sẽ xuất hiện, khả năng khái quát hóa mạnh mẽ hơn và khả năng chung trong các tình huống khác nhau.
** "Nhà tài chính" Xie Lirong: Khi nhiều người đổ tiền vào một ngành, bong bóng có thể là điều khó tránh khỏi. Nếu mô hình lớn được phát triển một cách lành mạnh, bạn có đề xuất gì? **
Hou Zhenyu: Lời khuyên của tôi dành cho những người hành nghề mô hình lớn là hãy làm những gì bạn có thể. Bạn không cần phải làm tất cả một mình. Thay vào đó, hãy xem xét việc thương mại hóa AI và tìm các kịch bản và chuỗi phù hợp nhất với khả năng của bạn. Chúng tôi hy vọng rằng khi ngành công nghiệp phát triển nhanh chóng trong giai đoạn đầu, một số bong bóng nhất định sẽ được cho phép. Tuy nhiên, chính sách có thể đạt được sự đồng thuận về giám sát ứng dụng công nghệ và các tiêu chuẩn của ngành để đánh giá chất lượng công nghệ. Có những tiêu chuẩn để tuân theo và các quy tắc để tuân theo, để chúng ta có thể phát triển một cách lành mạnh.
Zhu Yong: Chúng ta cũng cần thay đổi cách suy nghĩ. Mô hình lớn là công nghệ đầu nguồn, công nghệ lật đổ. Giữ một tâm trí cởi mở và tiếp tục học hỏi.