Диалог | За три месяца родилось 79 базовых крупномасштабных моделей Какие крупномасштабные модели нужны Китаю?

Текст: У Цзюнюй Редактор: Се Лижун

Источник: Финансы Одиннадцать.

Источник изображения: сгенерировано Unbounded AI

После выпуска ChatGPT в конце прошлого года китайские компании выпустили как минимум 79 основных крупных моделей. Однако внешний мир считает, что большинство крупных моделей имеют технический разрыв с ChatGPT. Крупномасштабный модельный бизнес неизбежен, какая масштабная модель нужна Китаю?

В декабре 2022 года OpenAI, стартап в области искусственного интеллекта, инвестируемый Microsoft, запустил разговорный AI ChatGPT. ChatGPT — это, по сути, большая модель языка GPT, независимо разработанная OpenAI, которая содержит почти 180 миллиардов параметров. В феврале этого года генеральный директор Nvidia Хуан Ренсюнь прокомментировал, что «ChatGPT открыл момент iPhone для ИИ». Хуанг Ренсюнь считает, что большие модели снижают порог для разработки приложений, и все приложения стоит переделывать с большими моделями.

Это не слова семьи Хуан Renxun, все видят возможность. Начиная с марта этого года китайские компании также соревнуются в выпуске крупносерийных моделей продукции. К ним относятся ведущие компании, такие как модель Wenxin Baidu, модель Ali Tongyi и отраслевая модель Tencent, а также отраслевые компании, такие как Xunfei и SenseTime, а также ряд начинающих компаний. В мае Китайский институт научной и технологической информации при Министерстве науки и технологий опубликовал «Отчет об исследовании большой модели карты искусственного интеллекта Китая». Согласно отчету, по состоянию на 28 мая в Китае выпущено не менее 79 базовых крупномасштабных моделей с параметрами выше 1 миллиарда.

Большое значение имеет количество параметров модели. В настоящее время ведущие компании, такие как Baidu и Ali, объявляют, что объем параметров Wenxin и Tongyi обычно находится на уровне 100 миллиардов, например, объем параметров большой модели Wenxin составляет 260 миллиардов. Параметры крупных моделей других предприятий или начинающих компаний обычно находятся на уровне 10 миллиардов или 1 миллиарда.

**Хотя все модели ИИ, выпущенные в настоящее время на рынке, называются «большими моделями», количество параметров по умолчанию считается одним из определяющих факторов для больших и малых моделей. ** Хоу Чжэньюй, вице-президент Baidu Group, сказал корреспонденту Caijing, что модель с 1 миллиардом параметров в 2022 году называется большой моделью. Но текущие большие параметры модели часто составляют сотни миллиардов. Поскольку появится эффект «интеллектуального возникновения» с более чем 100 миллиардами параметров, будет сформирована способность к обобщению, и будет сформирована универсальная способность в различных сценариях. Точно настроенная модель, основанная на этой большой модели, имеет лучший эффект промышленного применения.

**Эффект «интеллектуального появления» относится к тому факту, что после того, как масштаб модели и уровень вычислительной мощности превысят определенный порог параметра, эффект ИИ больше не будет событием случайной вероятности. ** В общем случае, чем больше количество параметров, тем больше вероятность появления интеллекта в целом и тем выше точность ИИ. В выделенном вертикальном поле легче получить точные результаты после обрезки и оптимизации модели с большими параметрами.

Хотя в Китае появилось не менее 79 крупномасштабных моделей, многие профессионалы отрасли, опрошенные Caijing, считают, что крупномасштабные модели требуют вычислительной мощности, алгоритмов и накопления данных. Из-за нехватки высокопроизводительных чипов графического процессора, высоких затрат на закупку оборудования и высоких эксплуатационных расходов в Китае очень мало компаний, обладающих капиталом, стратегической волей и практическими возможностями для коммерциализации крупных моделей. В «Войне сотен моделей» действительно существует разрыв между большинством продуктов и ChatGPT.

После скандала большая модельная мания постепенно возвращается к реальности. На рынке крупномасштабных моделей в стране и за рубежом появляется более рациональное мышление: ChatGPT, который не может быть коммерциализирован, может быть только игрушкой, а крупномасштабная модель, которая может стать корпоративным приложением, имеет промышленную ценность.

Такие компании, как Apple, Samsung и JPMorgan Chase, запретили сотрудникам использовать ChatGPT из соображений безопасности. С другой стороны, рост и удержание пользователей ChatGPT также достигли узкого места. Согласно данным инструмента анализа веб-сайтов SimilarWeb, темпы роста трафика ChatGPT с января по май составили 131,6%, 62,5%, 55,8%, 12,6% и 2,8%. В начале июня опрос Morgan Stanley показал, что только 19% респондентов заявили, что использовали ChatGPT, и только 4% заявили, что полагаются на ChatGPT.

Хоу Чжэньюй сказал: «В марте этого года, когда клиенты впервые начали говорить с нами о потребностях в крупномасштабных моделях, все они использовали свое воображение, прося больше научной фантастики. Но после апреля ограничения крупных… были выявлены масштабные модели, и все замедлились, постепенно стали появляться более актуальные потребности».

**Коммерциализация больших моделей на этапе To C идет медленно. **В настоящее время мы сталкиваемся с такими проблемами, как высокая стоимость вычислительных мощностей, и чем больше масштаб пользователей, тем больше потери предприятий. Кроме того, неизбежен вывод неправильного «шума», и существуют даже этические проблемы, такие как утечка информации и надзор за политикой. Даже Microsoft развертывает большие модели только в инструментальных продуктах (офисных офисных пакетах, веб-браузерах, инструментах для редактирования фотографий, таких как Photoshop). Суть продажи Microsoft услуг инструментальным компаниям по-прежнему заключается в коммерциализации To B.

**Это прагматичный подход к внедрению крупных моделей для корпоративных клиентов To B-end. ** На отраслевом рынке потребности клиентов ясны и очевидны. Розничная торговля, финансы, производство, правительство и другие сферы по всему миру полагаются на большие модели для интеллектуальных обновлений. Отраслевой консенсус заключается в том, что модель, которая была точно настроена на основе отраслевых знаний на основе большой модели, будет работать лучше, чем неоптимизированная большая модель общего назначения.

Согласно данным, опубликованным исследовательской фирмой IDC в мае этого года, общий объем китайского рынка искусственного интеллекта в 2022 году составит 12,2 млрд долларов США, включая 8,13 млрд долларов США на оборудование, 2,69 млрд долларов США на программное обеспечение и 1,41 млрд долларов США на услуги. IDC прогнозирует, что в 2026 году рынок искусственного интеллекта Китая достигнет 26,9 млрд долларов США, в том числе 14,85 млрд долларов США на оборудование, 7,69 млрд долларов США на программное обеспечение и 3,89 млрд долларов США на услуги. Совокупные годовые темпы роста аппаратного обеспечения, программного обеспечения и услуг составляют 15,1%, 32,0% и 28,5% соответственно.

Фанатизм всегда возвращается к реальности. В июне «Финанс» провел диалог с Хоу Женью, вице-президентом Baidu Group, и Чжу Юном, вице-президентом Baidu Smart Cloud, на тему «Какая модель действительно нужна Китаю?» Хоу Женью и Чжу Юн активно участвовал в Baidu Wenxin Qianfan. В этом разговоре мы обсудили три основных вопроса: создание модельной платформы и формирование коммерческой экологии: является ли большая модель роскошной игрой? Какая большая модель нужна предприятию? Есть ли пузырь на рынке больших моделей?

Профиль собеседника:

Хоу Чжэньюй, вице-президент Baidu Group (отвечает за исследовательскую группу по производству облачных вычислений и группу разработчиков базовых технологий Baidu Smart Cloud Business Group)

Чжу Юн, вице-президент Baidu Smart Cloud (отвечает за Центр приложений Baidu Smart Cloud)

Ведущий: Се Лижун, заместитель главного редактора журнала Caijing

Ниже приводится сжатая версия записи диалога:

**Является ли большая модель роскошной игрой? **

** «Финансовый» Се Лижун: Китай вызвал волну крупномасштабного предпринимательства, и порог для крупномасштабных моделей очень высок, но нынешняя ситуация на китайском рынке не выглядит таковой с точки зрения скорость и масштаб входа? **

Чжу Юн: Пороговое значение для крупных моделей относительное, и будут разные типы игроков. Первая категория такая же, как Baidu, создание базовой большой модели с нуля. Это предъявляет очень высокие требования к вычислительной мощности, алгоритмам, данным и талантам.

Если взять данные в качестве примера, базовая большая модель требует обучения массивным данным, включая данные из Интернета, профессиональные полевые данные, данные новостной информации и высококачественные данные с профессиональной маркировкой. Возьмем в качестве примера вычислительную мощность: большую модель с сотнями миллиардов параметров, такую как ChatGPT, необходимо непрерывно обучать в течение 100 дней с помощью самого мощного графического процессора NVIDIA A100/H100. Алгоритмы и таланты также являются ключевыми. У инженеров разные методы обучения, так же как разные повара готовят блюда с разным вкусом из одного и того же сырья. Это требует накопления многолетнего практического опыта, поэтому порог очень высок.

Вторая категория — это крупная отраслевая модель, которая требует тонкой настройки и целенаправленной настройки на основе возможностей базовой крупной модели. Это намного ниже, чем стоимость маркировки данных и тонкой настройки алгоритма с нуля в прошлом. Третья категория разрабатывает приложения на основе первых двух больших моделей.Baidu, другие компании и даже некоторые платформы с открытым исходным кодом предоставляют средства разработки, позволяющие снизить порог для разработки программного обеспечения.

** «Финансовый» Се Лижун: Каков уровень крупномасштабных моделей Китая на мировом рынке? **

**Хоу Чжэньюй:**Лично я считаю, что китайские крупномасштабные модели по-прежнему лидируют на мировом рынке. Разработка крупномасштабных моделей и разработка поисковых систем на самом деле похожи, и обе требуют очень глубокого технического опыта. С глобальной точки зрения, есть только несколько стран с независимыми исследованиями и разработками технологий поисковых систем. В настоящее время Китай и Соединенные Штаты могут быть единственными двумя странами, которые могут полностью независимо разрабатывать технологии крупномасштабных моделей.

** "Финансы" Се Лижун: Есть ли в крупных моделях абсолютное продвижение и отставание? **

**Хоу Чжэньюй: **Большие модели не бывают абсолютно хорошими или плохими. Хотя это может иметь определенные различия в разных областях, это похоже на выбор смартфона. Кто-то использует Apple, кто-то Android, самый подходящий — лучший. Когда большая модель была впервые запущена, люди часто задавали о ней каверзные вопросы. Но на самом деле в действительно серьезной среде корпоративного уровня таких сценариев очень мало. Предприятиям необходимо выбрать большую модель, которая больше подходит им в соответствии с их бизнес-сценариями. Китайским компаниям, в частности, необходимо выбирать продукты, которые лучше понимают китайский язык и подходят для характеристик китайских компаний.

** «Финансы» Се Лижун: Сколько ресурсов и талантов Baidu вложила в крупномасштабную модель? **

**Хоу Чжэньюй: **Крупномасштабная модель искусственного интеллекта является основной стратегией Baidu, которая требует непрерывных и комплексных высокоинтенсивных инвестиций. Если взять в качестве примера вычислительную мощность, количество GPU, которые мы накопили в прошлом, измеряется десятками тысяч, что является огромным вложением. Baidu также разработала полный набор наборов инструментов для более быстрого и качественного обучения моделей.

За последние 10 лет Baidu инвестировала более 100 миллиардов юаней в ИИ. Как технологическая компания, Baidu ежегодно тратит более 20% своего дохода на исследования и разработки. (Примечания: после 2019 года основные расходы Baidu на исследования и разработки в течение длительного времени составляли более 20% доходов. В 2022 году уровень расходов Baidu на исследования и разработки составлял 24%, уступая только 25% Huawei среди китайских технологических компаний. Основные расходы Baidu относятся к исключению Aiqi Baidu имеет свой бизнес после искусства), но большая модель не так проста, как вложение суммы денег, чтобы сделать модель.Требуется вычислительная мощность, данные и опытные инженеры ИИ, чтобы накопить в течение длительного времени на хорошем Платформа НИОКР.

**«Финансы» Се Лижун: Помимо денег, карт и данных, какие проблемы возникают у начинающей компании при создании базовой крупномасштабной модели? **

**Хоу Чжэньюй: **Деньги, карты и данные сами по себе очень сложны. Начинающие компании создают базовые крупномасштабные модели.Помимо минимальной вычислительной мощности, достаточного количества качественных данных и опытного персонала по исследованиям и разработкам в области ИИ, им также нужна платформа для разработки ИИ, которая может хорошо управлять моделями и вычислительной мощностью. В настоящее время крупные компании будут использовать эти платформы для предоставления внешних услуг в виде облаков. Например, Baidu Smart Cloud предоставляет внешние услуги через платформу крупномасштабных моделей Wenxin Qianfan. Однако порог обучения базовой большой модели с нуля все еще очень высок. Поскольку большой модели недостаточно для обучения, она также требует непрерывных гибких итераций, и крупные компании будут относительно более зрелыми.

** "Финансовый" Се Лижун: Некоторые компании начинают создавать свои собственные крупные модели. Нужно ли строить большую модель самостоятельно? Когда публичное облако только появилось в 2014 году, некоторые клиенты беспокоились о безопасности данных, а также беспокоятся ли они об этом при использовании больших моделей? **

**Хоу Чжэньюй:**Каждая компания должна использовать крупномасштабную модель, но нужно ли каждому предприятию создавать крупномасштабную модель самостоятельно? Я так не думаю. Самостоятельно делать базовую большую модель с нуля очень дорого. Предприятия могут использовать свои собственные данные для тонкой настройки базовых моделей других людей, и они также могут достигать очень хороших результатов.

Чжу Юн: Я считаю, что предприятия должны больше думать о том, как использовать большие модели и как эффективно использовать большие модели. У каждого бизнеса может быть свой макет, но нет необходимости начинать все сначала. Потому что такие компании, как Baidu, обеспечили хорошую техническую базу. Вы можете положиться на Baidu, чтобы сделать некоторые индивидуальные продукты, которые являются более экономичным выбором для клиентов. Проблема безопасности данных не является новой проблемой, вызванной появлением больших моделей. Если сравнивать с облачными вычислениями, то есть общедоступное облако, частное облако, хостинг и так далее. В крупномасштабной бизнес-модели мы полностью рассмотрели соответствующие продукты и решения.

** «Финансовый» Се Лижун: Популярность смартфонов и облачных сервисов обусловлена низкой ценой. Когда большая модель Китая войдет в стадию общего применения? **

Хоу Чжэньюй: Большая модель сама по себе позволяет значительно сэкономить. В прошлом, когда предприятия разрабатывали приложения ИИ, им нужно было выполнять очистку данных, маркировку, обучение моделей, рассуждения и оптимизацию в соответствии со сценариями приложений. Независимо от того, насколько мала сцена, весь процесс должен быть выполнен, а стоимость очень высока. Но, исходя из большой модели, в прошлом не было необходимости в таком большом количестве данных, времени, ресурсов и рабочей силы. Я предлагаю предприятиям обратить внимание и как можно скорее использовать технологию крупномасштабных моделей, потому что она может значительно снизить порог применения ИИ.

**Какие большие модели нужны китайским компаниям? **

** «Финансы» Се Лижун: масштабная модель Baidu Wenxin начала внутреннее тестирование в марте. Может ли предприятие в ходе внутреннего тестирования четко выдвинуть свои потребности? Где сосредоточены их потребности? **

**Чжу Юн:**После внутреннего тестирования в марте мы последовательно получили запросы на доступ от более чем 150 000 клиентов. В то же время сотни партнеров проводят с нами исследования и испытания на месте. Это охватывает различные отрасли, такие как Интернет, производство и финансы, и многие сценарии в нем представляют большую ценность. Подводя итог, можно выделить несколько категорий высокочастотных сценариев: управление знаниями, создание контента (включая маркетинговый копирайтинг, информацию для СМИ), интеллектуальное обслуживание клиентов, генерация кода и повышение эффективности офиса.

** «Финансовый» Се Лижун: На рынке цифровой трансформации существует давняя проблема: многие клиенты не знают, чего хотят. В области больших моделей тоже существует это противоречие? **

**Чжу Юн: **Действительно существуют различия между разными отраслями и разными клиентами. После выхода большой модели интернет-индустрия обратила пристальное внимание на свои последние разработки.Их техническое понимание и знание продукта очень продвинуты, поэтому мы можем быстро проводить совместные исследования и испытания, а также создавать демонстрации и инновационные продукты.

Цифровая основа некоторых традиционных отраслей относительно слаба, поэтому Baidu будет иметь большое количество инженеров, которые будут работать совместно с клиентами, объединять возможности ИИ с их отраслевыми болями и создавать множество очень новых концепций продуктов. Когда технология ИИ сочетается с промышленностью, необходимо понимать технологию и ИИ, с одной стороны, и понимать отрасль, с другой стороны. Поэтому, когда мы связываемся с клиентами и партнерами, нам часто нужно, чтобы обе стороны работали вместе.

** «Финансовый отдел» Се Лижун: Как Baidu предоставляет услуги крупномасштабных моделей различным отраслям и разным типам клиентов? Как оценить эффективность затрат с точки зрения клиента? **

Чжу Юн: С точки зрения цены, если предприятие только пробует и чувствительно к цене, оно может использовать общедоступные облачные сервисы. ) не требует разовых инвестиций Инвестиции в оборудование также являются преимуществом общедоступного облака. Некоторые компании готовы вкладывать большие средства в инфраструктуру и создавать собственные интеллектуальные приложения, Baidu может предоставить полный набор моделей ИИ и баз ИИ, а компании могут разрабатывать приложения на основе моделей ИИ и баз ИИ.

** "Финансовый" Се Лижун: Как компании выбирают крупную модель, которая им подходит? **

Хоу Чжэньюй: Во-первых, это должен быть эффект модели, который является основанием для выбора большой модели. Предприятиям необходимо оценить ценность, которую большие модели могут сыграть в сценариях использования. Во-вторых, сосредоточьтесь на скорости итерации. Это зависит не только от того, жизнеспособна ли сама базовая большая модель, но и от того, имеет ли платформа полную цепочку инструментов, поддерживает ли она удобную вторичную разработку и переобучение модели, а также поддерживает ли она лучшую итерацию больших моделей. В-третьих, фактическая стоимость посадки и форма доставки крупной модели. Предприятия могут выбрать режим доставки общедоступного облака и частного облака в соответствии со своими потребностями.

** «Финансовый» Се Лижун: Wenxin Qianfan позиционируется как универсальная крупномасштабная модельная платформа корпоративного уровня, как понять «универсальный» и «уровень предприятия»? **

Хоу Чжэньюй: Во-первых, универсальный ИИ — это технология, основанная на данных. С самого начала ИИ необходимо собирать, очищать и маркировать данные, а затем проводить обучение на основе существующих моделей, а после обучения управлять отлаженными данными и версиями моделей и, наконец, использовать их в бизнесе. . Это целый процесс. Baidu предоставляет эти возможности, и он очень прост в использовании, что может удовлетворить потребности клиентов на протяжении всего жизненного цикла от исследований и разработок ИИ до применения.

Помимо «уровня предприятия», приложения уровня предприятия не являются личными приложениями, не такими простыми, как загрузка фотографий. Приложения корпоративного уровня будут более совершенными и сложными, и необходимо учитывать такие факторы, как масштабируемость, масштабируемость, затраты на внедрение, а также стабильность и надежность.

** «Финансы» Се Лижун: По данным Baidu, крупномасштабная модельная платформа Wenxin Qianfan имеет шесть характеристик: простота использования, безопасность, комплексность, эффективность, открытость и интегрированность. Почему простота использования должна стоять на первом месте? Правда ли, что будут популяризироваться только полезные технологии? **

**Хоу Женюй: **Простота использования очень важна. Большая модель естественного языка может предоставить клиентам более простой в использовании интерфейс, который удобен для всех для взаимодействия с машиной. «Интеграция облака и интеллекта, инклюзивность ИИ» — это стратегия Baidu Smart Cloud, а «инклюзивность ИИ» всегда была одним из наших идеалов. ИИ не может быть просто технологией высоко в башне из слоновой кости.Необходимо снизить порог использования ИИ, включая порог использования данных, использования ресурсов и использования ИИ человеком.Поэтому простота использования очень важна.

** «Финансы» Се Лижун: За последние три месяца модели искусственного интеллекта стали широко известны публике. Для тысяч отраслей появилась ли коммерческая возможность для больших моделей? Каким должен быть хороший деловой ритм? **

**Чжу Юн: **Большая модель искусственного интеллекта имеет очень четкие изменения в парадигмах исследований и разработок и приложений. Чем раньше вы примете и поймете большую модель, тем больше она повлияет на бизнес. Это не вопрос да или нет. Когда дело доходит до темпа, разные компании используют большие модели по-разному. Некоторые предприятия могут начать с пробной версии приложения в одной точке и использовать общедоступное облако для вызова служб, чтобы они могли быстро проверить и выполнить демо-разработку с меньшими затратами.

С другой стороны, независимо от того, крупное это предприятие или маленькое, необходимо развивать естественное мышление ИИ. Например, некоторые приложения можно трансформировать и обновлять постепенно. Другой подход называется рефакторингом.Согласно внутреннему заявлению Baidu, все продукты в будущем будут переделываться на основе большой модели.

** Есть ли пузырь на рынке больших моделей? **

** "Финансовый" Се Лижун: Вам действительно нужно так много больших моделей на рынке B-end, ориентированном на бизнес? **

**Хоу Женюй:**Мое личное мнение, что для базовой большой модели не нужно так много. Конечно, это просто с нетерпением жду конца. Но в начале развития любой отрасли рынок становится процветающим и пенистым. С точки зрения промышленного развития, сейчас мы должны допустить некоторые пузыри. Мы также должны признать это. Но я все еще считаю, что после того, как большие волны смыли песок, все еще есть несколько компаний, которые в конечном итоге предоставляют базовые модельные услуги.

**Чжу Юн: **В направлении базовой большой модели, хотя сейчас есть много игроков, действительно сложно поддерживать быструю итерацию, постоянно разрабатывать более полную и полную цепочку инструментов и постоянно улучшать возможности продукта в зависимости от клиента. вещи обратной связи. Поэтому, хотя большая модель сейчас может быть очень популярной, это гонка на длинные дистанции.В конце концов, это будет похоже на сегодняшний ландшафт облачных вычислений, и рынок будет постепенно сходиться.

** «Финансовый» Се Лижун: Многие компании, производящие серверное оборудование, также хотят создавать крупномасштабные отраслевые модели. Baidu раньше был их клиентом, но теперь они конкурируют друг с другом. Как нам мирно жить вместе? **

Хоу Чжэньюй: Я не думаю, что мы можем напрямую говорить о конкуренции.В первую очередь мы по-прежнему сотрудничаем. Обе стороны действительно будут иметь схожие услуги и работать в схожих отраслях одновременно, но мы и традиционные производители оборудования больше дополняем друг друга. Baidu — это компания, занимающаяся искусственным интеллектом, с интернет-генами, накопившая большой объем данных общего назначения и крупную модель общего назначения.Ее преимущества заключаются в искусственном интеллекте, программном обеспечении, технологиях и других областях. Традиционные производители оборудования накопили отраслевые данные и разработали ноу-хау в вертикальных областях, таких как традиционные государственные и корпоративные отрасли. Обе стороны имеют разные сильные стороны в построении больших моделей. Такие предприятия, как Baidu и H3C, не только являются партнерами по закупке серверов и коммутаторов, но и совместно создают крупные модели.

** «Финансовый» Се Лиронг: Baidu обычно обращает внимание на успехи крупных моделей конкурентов? **

Чжу Юн: Во-первых, технология и общий эффект. Во-вторых, вспомогательные инструменты. В-третьих, бизнес-модель. Если вернуться на три-четыре года назад, рынок искусственного интеллекта был еще относительно далек, но сегодня технологии глубокого обучения, коммерциализация продуктов, инвестиции и экология с открытым исходным кодом набирают обороты.

** «Финансовый» Се Лижун: Будут ли в ближайшие несколько лет крупномасштабные модели ключевым направлением ядра Baidu? Почему? **

**Хоу Чжэньюй: **Большие модели будут в центре внимания Baidu. Baidu — компания, занимающаяся искусственным интеллектом, а крупные модели — важное направление развития искусственного интеллекта. Будь то на стороне C или на стороне B, это внесет огромные изменения в продукты и услуги Baidu. Для Baidu очень интересны большие модели, что является одновременно и возможностью, и вызовом. Baidu продолжит инвестировать в большие модели. Я считаю, что большие модели ускорят облачные вычисления в эпоху ИИ и изменят ландшафт облачных вычислений. Статус MaaS (модель как услуга) будет становиться все более и более важным, и это также ускорит реализацию стратегии Baidu «интеграция облака и интеллекта» и идеала «инклюзивности ИИ», предложенного Smart Cloud.

** «Финансовый» Се Лижун: Последний раунд коммерциализации искусственного интеллекта, начавшийся в 2016 году, имел некоторые проблемы, и компаниям, занимающимся искусственным интеллектом, пришлось выполнять множество утомительных и подробных проектов по настройке. Как большие модели могут избежать проблем, возникших на последнем этапе коммерциализации искусственного интеллекта? **

Хоу Чжэньюй: Этот раунд крупномасштабной индустрии моделей отличается от индустрии искусственного интеллекта, представленной глубоким обучением десять лет назад. Это новая парадигма исследований и разработок в области ИИ, которая отличается от предыдущих инвестиций. До появления крупномасштабных моделей ИИ подвергался наибольшей критике, а самым сложным для реализации было то, что фактическая промышленная среда была фрагментирована. Например, распознавание лица на воротах и распознавание лица при оплате различаются. Поскольку свет и окружающая среда разные, их необходимо ориентировать на разные приложения, а обучение следует проводить с нуля в соответствии с данными, накопленными клиентами, а затем адаптировать к сцене. Этот вид индивидуальной доставки очень громоздкий.

Но в базовой большой модели можно получить очень хорошие результаты без слишком большого количества данных для тонкой настройки и без слишком большого количества раундов обучения. Базовые большие модели решают многие сценарии намного проще, чем раньше. Обобщающая способность больших моделей намного сильнее, чем раньше. Это отличается от последнего раунда посадки ИИ. В прошлом году модель с 1 миллиардом параметров называлась большой моделью, но сейчас параметры модели часто исчисляются сотнями миллиардов. С более чем 100 миллиардами параметров появится интеллект, более сильные возможности обобщения и общие возможности в различных сценариях.

** «Финансовый» Се Лижун: Когда в отрасль вливается много людей, пузыри могут быть неизбежны. Какие у вас есть предложения, если большая модель должна быть разработана здоровым образом? **

Хоу Чжэньюй: Мой совет практикующим крупным моделям: делайте то, что можете. Вам не нужно делать все это самостоятельно. Вместо этого подумайте о коммерциализации ИИ и найдите сценарии и цепочки, которые лучше всего соответствуют вашим возможностям. Мы надеемся, что когда отрасль быстро развивается на ранней стадии, определенные пузыри допускаются. Тем не менее, политика может достичь консенсуса в отношении надзора за применением технологий и отраслевых стандартов оценки качества технологий. Есть стандарты, которым нужно следовать, и правила, которым нужно следовать, чтобы мы могли развиваться здоровым образом.

Чжу Юн: Нам также нужно изменить образ мышления. Большая модель — это технология водораздела, подрывная технология. Сохраняйте непредвзятость и продолжайте учиться.

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить