«Мы живем в эпоху глобальной конкуренции за создание лучших базовых моделей. Вычислительная мощность и архитектура моделей важны, но настоящая защита — это обучающие данные.»
—Сандип Чинчали, главный директор по ИИ, Story
Давайте поговорим о потенциале AI Data track с точки зрения Scale AI
Самый большой слух в кругу ИИ в этом месяце — это то, что Meta демонстрирует свои финансовые возможности. Цукерберг набирает таланты повсюду и сформировал роскошную команду Meta AI, состоящую в основном из китайских научных работников. Лидер команды — Александр Ванг, которому всего 28 лет, он основал Scale AI. Он основал Scale AI, и в настоящее время компания оценивается в 29 миллиардов долларов США. Объектами обслуживания являются Вооруженные силы США, а также OpenAI, Anthropic, Meta и другие конкурирующие гиганты ИИ, все из которых полагаются на данные, предоставляемые Scale AI. Основной бизнес Scale AI заключается в предоставлении большого объема точных размеченных данных.
Почему Scale AI выделяется среди группы единорогов?
Причина в том, что он рано осознал важность данных в AI-индустрии.
Вычислительная мощность, модели и данные – это три столпа AI моделей. Если большой модель сравнить с человеком, то модель является телом, вычислительная мощность – пищей, а данные – знанием/информацией.
С тех пор, как возникли LLM, акцент в развитии отрасли также сместился с моделей на вычислительную мощность. Сегодня большинство моделей используют трансформеры в качестве модельной структуры, с редкими инновациями, такими как MoE или MoRe. Крупные гиганты либо построили свои собственные супер-кластеры для завершения Великой стены вычислительной мощности, либо подписали долгосрочные соглашения с мощными облачными сервисами, такими как AWS. Как только базовая вычислительная мощность удовлетворена, важность данных постепенно становится более заметной.
В отличие от традиционных компаний по работе с большими данными для B, таких как Palantir, которые имеют яркую репутацию на вторичном рынке, Scale AI, как следует из названия, стремится создать прочную базу данных для AI-моделей. Его бизнес не ограничивается добычей существующих данных, но также сосредоточен на долгосрочном бизнесе по генерации данных. Он также пытается сформировать команду тренеров AI через искусственных экспертов в различных областях, чтобы предоставить более качественные тренировочные данные для обучения AI-моделей.
Если вы не согласны с этим бизнесом, давайте посмотрим, как обучается модель.
Обучение модели делится на две части - предварительное обучение и дообучение.
Предварительная часть обучения немного похожа на процесс, когда человеческие младенцы постепенно учатся говорить. Обычно нам нужно накормить ИИ-модель большим объемом текста, кода и другой информации, полученной с помощью онлайн-краулеров. Модель сама изучает эти материалы, учится говорить на человеческом языке (, который в академических кругах называется естественным языком ), и приобретает базовые навыки общения.
Часть тонкой настройки схожа с посещением школы, где обычно есть четкие правильные и неправильные ответы и направления. Школы будут готовить студентов к различным талантам в зависимости от их соответствующей специализации. Мы также будем использовать некоторые предварительно обработанные и целевые наборы данных для обучения модели для достижения ожидаемых нами возможностей.
На данный момент вы, возможно, уже поняли, что данные, которые нам нужны, также делятся на две части.
Некоторые данные не требуют слишком тщательной обработки, достаточно просто достаточного объема, обычно это данные, полученные с помощью веб-сканеров с крупных UGC платформ, таких как Reddit, Twitter, Github, публичные литературные базы данных, корпоративные закрытые базы данных и т.д.
Другая часть, такая как профессиональные учебники, требует тщательного проектирования и отбора, чтобы гарантировать, что специфические выдающиеся качества модели могут быть развиты. Это требует от нас выполнения некоторых необходимых работ, таких как очистка данных, отбор, маркировка и ручная обратная связь.
Эти два набора данных составляют основную часть трека AI Data. Не стоит недооценивать эти, казалось бы, низкотехнологичные наборы данных. Текущая мейнстримная точка зрения заключается в том, что по мере того как преимущество вычислительной мощности в законах масштабирования постепенно становится неэффективным, данные станут самым важным столпом для различных производителей крупных моделей, чтобы сохранить свое конкурентное преимущество.
По мере того как возможности моделей продолжают улучшаться, более сложные и профессиональные обучающие данные станут ключевыми влияющими переменными на возможности моделей. Если мы далее сравним обучение моделей с культивированием мастеров боевых искусств, то качественные наборы данных являются лучшими секретами боевых искусств (, чтобы завершить эту метафору, мы также можем сказать, что вычислительная мощность является панацеей, а модель — это сама квалификация ).
С вертикальной точки зрения, AI Data также является долгосрочной траекторией с возможностью наращивания. С накоплением предыдущей работы, данные активы также будут иметь возможность компаундирования и будут становиться более популярными с возрастом.
Web3 DataFi: Выбранная плодородная почва для данных ИИ
В сравнении с удаленной командой ручной разметки Scale AI, состоящей из сотен тысяч человек на Филиппинах, в Венесуэле и других местах, Web3 имеет естественное преимущество в области данных ИИ, и новый термин DataFi был рожден.
В идеале преимущества Web3 DataFi следующие:
Суверенитет данных, безопасность и конфиденциальность, гарантированные смарт-контрактами
На этапе, когда существующие публичные данные находятся на грани разработки и исчерпания, как дальше извлекать недоступные данные, даже частные данные, является важным направлением для получения и расширения источников данных. Это ставит перед важной проблемой выбора доверия - выбираете ли вы систему выкупа контрактов крупной централизованной компании и продаете свои данные; или выбираете метод блокчейна, продолжаете держать IP данных в своих руках и четко понимаете через смарт-контракты: кто использует ваши данные, когда и с какой целью.
В то же время для обработки конфиденциальной информации вы можете использовать zk, TEE и другие методы, чтобы гарантировать, что ваши личные данные будут обрабатываться только машинами, которые хранят молчание и не будут утечены.
Природное географическое арбитражное преимущество: свободная распределенная архитектура для привлечения наиболее подходящей рабочей силы
Возможно, пришло время бросить вызов традиционным отношениям трудовой эксплуатации. Вместо того чтобы искать дешевую рабочую силу по всему миру, как это делает Scale AI, лучше воспользоваться распределенными характеристиками блокчейна и позволить рабочей силе, разбросанной по всему миру, участвовать в внесении данных через открытые и прозрачные стимулы, гарантированные смарт-контрактами.
Для трудоемких задач, таких как разметка данных и оценка модели, использование Web3 DataFi более способствует разнообразию участников, чем централизованный подход к созданию данных фабрик, что также имеет долгосрочное значение для избежания предвзятости данных.
Явные преимущества блокчейна в области стимулов и расчетов
Как избежать трагедии "Фабрики кожи Цзяннань"? Естественно, мы должны использовать систему стимулов с четкими ценниками в смарт-контрактах, чтобы заменить темноту человеческой природы.
В условиях неизбежной деглобализации, как мы можем продолжать достигать низкозатратного географического арбитража? Очевидно, что открывать компании по всему миру стало сложнее, так почему бы не обойти барьеры старого мира и не принять метод расчетов на блокчейне?
Это способствует созданию более эффективного и открытого "одного окна" рынка данных
"Посредники, зарабатывающие на разнице в ценах", — это вечная проблема как для стороны предложения, так и для стороны спроса. Вместо того чтобы позволять централизованной компании по обработке данных действовать в качестве посредника, лучше создать платформу на блокчейне, через открытый рынок, такой как Таобао, чтобы стороны предложения и спроса на данные могли соединяться более прозрачно и эффективно.
С развитием экосистемы ИИ на блокчейне спрос на данные в цепочке станет более активным, сегментированным и разнообразным. Только децентрализованный рынок сможет эффективно переработать этот спрос и превратить его в экологическое процветание.
Для розничных инвесторов DataFi также является самым децентрализованным проектом ИИ, который наиболее способствует участию обычных розничных инвесторов.
Хотя появление инструментов ИИ снизило порог обучения в определенной степени, и изначальная цель децентрализованного ИИ заключается в разрыве текущей монополии гигантов в бизнесе ИИ; тем не менее, необходимо признать, что многие текущие проекты не очень доступны для розничных инвесторов без технического фона - участие в майнинге децентрализованных вычислительных сетей часто связано с дорогостоящими начальными инвестициями в оборудование, а технический порог рынка моделей всегда может легко оттолкнуть обычных участников.
В отличие от этого, это одна из немногих возможностей, которые обычные пользователи могут использовать в революции ИИ. Web3 позволяет вам участвовать в этом, выполняя различные простые задачи, включая предоставление данных, маркировку и оценку моделей на основе интуиции и инстинкта человеческого мозга, или дальнейшее использование инструментов ИИ для выполнения некоторых простых творений, участвовать в сделках с данными и т.д. Для опытных пользователей партии Мао уровень сложности в основном равен нулю.
Потенциальные проекты Web3 DataFi
Где идут деньги, там и направление. Помимо того, что Scale AI получила инвестиции в размере 14,3 миллиарда долларов от Meta и акции Palantir выросли более чем в 5 раз за один год в мире Web2, DataFi также показала очень хорошие результаты в финансировании Web3. Здесь мы кратко представляем эти проекты.
Sahara AI, @SaharaLabsAI, привлек 49 миллионов долларов
Конечной целью Sahara AI является создание децентрализованной суперинфраструктуры ИИ и торгового рынка. Первым сектором, который будет протестирован, является AI Data. Публичная бета-версия его DSP (Data Services Platform) будет запущена 22 июля. Пользователи могут получать токен-вознаграждения, внося данные, участвуя в маркировке данных и других задачах.
Ссылка: app.saharaai.com
Да, @yupp_ai собрала 33 миллиона долларов
Yupp — это платформа обратной связи для моделей ИИ, которая собирает отзывы пользователей о результатах моделей. Основная задача заключается в том, что пользователи могут сравнивать результаты разных моделей для одного и того же запроса, а затем выбирать тот, который они считают лучшим. Завершение задачи позволяет заработать очки Yupp, которые можно обменять на фиатные стейблкоины, такие как USDC.
Ссылка:
Vana, @vana, собрала 23 миллиона долларов
Vana сосредотачивается на преобразовании личных данных пользователей (, таких как активности в социальных сетях, история просмотров и т. д. ) в монетизируемые цифровые активы. Пользователи могут авторизовать загрузку своих личных данных в соответствующий пул ликвидности данных (DLP) в DataDAOs. Эти данные будут объединены и использованы для участия в задачах, таких как обучение AI моделей, а пользователи также получат соответствующие токен-вознаграждения.
Ссылка:
Chainbase, @ChainbaseHQ, привлек 16,5 миллиона долларов
Бизнес Chainbase сосредоточен на данных в цепочке и в настоящее время охватывает более 200 блокчейнов, превращая действия в цепочке в структурированные, проверяемые и монетизируемые данные для разработки dApp. Бизнес Chainbase в основном осуществляется через многосетевую индексацию и другие методы, а данные обрабатываются с помощью его системы Manuscript и модели Theia AI. Обычные пользователи в настоящее время не очень вовлечены.
Sapien, @JoinSapien, собрал 15,5 миллиона долларов
Sapien ставит перед собой цель преобразовать человеческие знания в качественные данные для обучения ИИ в большом масштабе. Любой может выполнять аннотацию данных на платформе и обеспечивать качество данных через верификацию со стороны коллег. В то же время пользователям предлагается строить долгосрочную репутацию или делать обязательства через стекинг, чтобы зарабатывать больше наград.
Ссылка:
Prisma X, @PrismaXai, привлекла 11 миллионов долларов
Prisma X хочет стать открытым координационным слоем для роботов, где сбор физических данных является ключевым. Этот проект сейчас находится на ранних стадиях. Согласно недавно выпущенному белому документу, участие может включать инвестиции в роботов для сбора данных, удаленную работу с роботизированными данными и т.д. В настоящее время открыт тест на основе белого документа, и вы можете участвовать, чтобы заработать баллы.
Ссылка:
Masa, @getmasafi, собрал 8,9 миллиона долларов
Masa является одним из ведущих проектов подсетей в экосистеме Bittensor и в настоящее время управляет подсетью данных № 42 и подсетью агентов № 59. Подсеть данных стремится предоставить доступ к данным в реальном времени. В настоящее время майнеры в основном собирают данные в реальном времени с X/Twitter с помощью аппаратного обеспечения TEE. Для обычных пользователей сложность и стоимость участия относительно высоки.
Irys, @irys_xyz, собрала 8,7 миллиона долларов
Irys сосредоточен на программируемом хранении данных и вычислениях, стремясь предоставить эффективные и недорогие решения для ИИ, децентрализованных приложений (dApps) и других приложений, требующих большого объема данных. Что касается вклада в данные, то обычные пользователи в настоящее время не могут участвовать в значительной степени, но есть множество мероприятий для участия на текущем этапе тестовой сети.
Ссылка:
ORO, @getoro_xyz, собрал 6 миллионов долларов
Что ORO хочет сделать, так это дать возможность обычным людям участвовать в вкладе в ИИ. Методы поддержки включают: 1. Привязка вашей личной учетной записи для внесения личных данных, включая социальные аккаунты, данные о здоровье, учетные записи электронной коммерции и финансовые счета; 2. Завершение задач по данным. Тестовая сеть сейчас в сети, и вы можете участвовать.
Ссылка: app.getoro.xyz
Gata, @Gata_xyz, собрала 4 миллиона долларов
Позиционируясь как децентрализованный слой данных, Gata в настоящее время имеет три ключевых продукта для участия: 1. Data Agent: серия AI-агентов, которые могут автоматически запускать и обрабатывать данные, как только пользователь откроет веб-страницу; 2. AII-in-one Chat: механизм, аналогичный оценке модели Yupp, для получения вознаграждений; 3. GPT-to-Earn: браузерное расширение, которое собирает данные разговоров пользователей на ChatGPT.
Ссылка:
Как вы смотрите на эти текущие проекты?
В настоящее время барьеры для входа в эти проекты, как правило, не высоки, но необходимо признать, что как только накапливаются пользователи и экологическая привязка, преимущества платформы будут быстро накапливаться. Поэтому на ранних стадиях усилия следует сосредоточить на стимулах и пользовательском опыте. Только привлекая достаточное количество пользователей, можно создать бизнес больших данных.
Однако, как трудоемкие проекты, этим платформам данных также следует учитывать, как управлять трудозатратами и обеспечивать качество выходных данных, привлекая при этом рабочую силу. В конце концов, распространенной проблемой многих проектов Web3 является то, что большинство пользователей на платформе являются просто безжалостными наживателями. Они часто жертвуют качеством ради краткосрочной выгоды. Если им позволят стать основными пользователями платформы, плохие деньги неизбежно вытеснят хорошие деньги, и в конечном итоге качество данных не сможет быть гарантировано, и покупателей нельзя будет привлечь. В настоящее время мы видим, что такие проекты, как Sahara и Sapien, подчеркивают качество данных и стремятся установить долгосрочные и здоровые кооперативные отношения с трудом на платформе.
Кроме того, отсутствие прозрачности является еще одной проблемой текущих проектов в цепочке. Действительно, невозможный треугольник блокчейна заставил многие проекты пойти по пути "централизация ведет к децентрализации" на стадии старта. Но теперь все больше и больше проектов в цепочке создают у людей впечатление "старых Web2 проектов в оболочке Web3" - есть очень мало публичных данных, которые можно отслеживать в цепочке, и даже дорожная карта трудно показывает долгосрочную решимость к открытости и прозрачности. Это, безусловно, токсично для долгосрочного здорового развития Web3 DataFi, и мы также надеемся, что больше проектов всегда будут сохранять свои первоначальные намерения и ускорять темпы открытости и прозрачности.
В конечном итоге путь массового принятия DataFi также следует разделить на две части: первая — привлечь достаточное количество участников toC для присоединения к сети, сформировав новую силу для сбора/генерации данных и потребителей ИИ-экономики, создавая экологический замкнутый цикл; вторая — получить признание от текущих ведущих компаний toB. В конце концов, в краткосрочной перспективе они являются основным источником крупных заказов на данные благодаря своим глубоким карманам. В этом отношении мы также видим, что Sahara AI, Vana и другие добились хорошего прогресса.
Заключение
Более фаталистично, DataFi заключается в использовании человеческого интеллекта для воспитания машинного интеллекта в долгосрочной перспективе, при этом используя смарт-контракты в качестве контракта для обеспечения прибыльности человеческого интеллектуального труда и в конечном итоге получения обратной связи от машинного интеллекта.
Если вы беспокоитесь о неопределенности эпохи ИИ и если у вас все еще есть блокчейн-идеи среди взлетов и падений в мире криптовалют, то следовать по стопам группы капитальных гигантов и присоединиться к DataFi — хороший выбор, чтобы идти в ногу со временем.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Данные как актив: DataFi открывает новое синее море
Автор: основной contributor Biteye @anci_hu49074
«Мы живем в эпоху глобальной конкуренции за создание лучших базовых моделей. Вычислительная мощность и архитектура моделей важны, но настоящая защита — это обучающие данные.»
—Сандип Чинчали, главный директор по ИИ, Story
Давайте поговорим о потенциале AI Data track с точки зрения Scale AI
Самый большой слух в кругу ИИ в этом месяце — это то, что Meta демонстрирует свои финансовые возможности. Цукерберг набирает таланты повсюду и сформировал роскошную команду Meta AI, состоящую в основном из китайских научных работников. Лидер команды — Александр Ванг, которому всего 28 лет, он основал Scale AI. Он основал Scale AI, и в настоящее время компания оценивается в 29 миллиардов долларов США. Объектами обслуживания являются Вооруженные силы США, а также OpenAI, Anthropic, Meta и другие конкурирующие гиганты ИИ, все из которых полагаются на данные, предоставляемые Scale AI. Основной бизнес Scale AI заключается в предоставлении большого объема точных размеченных данных.
Почему Scale AI выделяется среди группы единорогов?
Причина в том, что он рано осознал важность данных в AI-индустрии.
Вычислительная мощность, модели и данные – это три столпа AI моделей. Если большой модель сравнить с человеком, то модель является телом, вычислительная мощность – пищей, а данные – знанием/информацией.
С тех пор, как возникли LLM, акцент в развитии отрасли также сместился с моделей на вычислительную мощность. Сегодня большинство моделей используют трансформеры в качестве модельной структуры, с редкими инновациями, такими как MoE или MoRe. Крупные гиганты либо построили свои собственные супер-кластеры для завершения Великой стены вычислительной мощности, либо подписали долгосрочные соглашения с мощными облачными сервисами, такими как AWS. Как только базовая вычислительная мощность удовлетворена, важность данных постепенно становится более заметной.
В отличие от традиционных компаний по работе с большими данными для B, таких как Palantir, которые имеют яркую репутацию на вторичном рынке, Scale AI, как следует из названия, стремится создать прочную базу данных для AI-моделей. Его бизнес не ограничивается добычей существующих данных, но также сосредоточен на долгосрочном бизнесе по генерации данных. Он также пытается сформировать команду тренеров AI через искусственных экспертов в различных областях, чтобы предоставить более качественные тренировочные данные для обучения AI-моделей.
Если вы не согласны с этим бизнесом, давайте посмотрим, как обучается модель.
Обучение модели делится на две части - предварительное обучение и дообучение.
Предварительная часть обучения немного похожа на процесс, когда человеческие младенцы постепенно учатся говорить. Обычно нам нужно накормить ИИ-модель большим объемом текста, кода и другой информации, полученной с помощью онлайн-краулеров. Модель сама изучает эти материалы, учится говорить на человеческом языке (, который в академических кругах называется естественным языком ), и приобретает базовые навыки общения.
Часть тонкой настройки схожа с посещением школы, где обычно есть четкие правильные и неправильные ответы и направления. Школы будут готовить студентов к различным талантам в зависимости от их соответствующей специализации. Мы также будем использовать некоторые предварительно обработанные и целевые наборы данных для обучения модели для достижения ожидаемых нами возможностей.
На данный момент вы, возможно, уже поняли, что данные, которые нам нужны, также делятся на две части.
Эти два набора данных составляют основную часть трека AI Data. Не стоит недооценивать эти, казалось бы, низкотехнологичные наборы данных. Текущая мейнстримная точка зрения заключается в том, что по мере того как преимущество вычислительной мощности в законах масштабирования постепенно становится неэффективным, данные станут самым важным столпом для различных производителей крупных моделей, чтобы сохранить свое конкурентное преимущество.
По мере того как возможности моделей продолжают улучшаться, более сложные и профессиональные обучающие данные станут ключевыми влияющими переменными на возможности моделей. Если мы далее сравним обучение моделей с культивированием мастеров боевых искусств, то качественные наборы данных являются лучшими секретами боевых искусств (, чтобы завершить эту метафору, мы также можем сказать, что вычислительная мощность является панацеей, а модель — это сама квалификация ).
С вертикальной точки зрения, AI Data также является долгосрочной траекторией с возможностью наращивания. С накоплением предыдущей работы, данные активы также будут иметь возможность компаундирования и будут становиться более популярными с возрастом.
Web3 DataFi: Выбранная плодородная почва для данных ИИ
В сравнении с удаленной командой ручной разметки Scale AI, состоящей из сотен тысяч человек на Филиппинах, в Венесуэле и других местах, Web3 имеет естественное преимущество в области данных ИИ, и новый термин DataFi был рожден.
В идеале преимущества Web3 DataFi следующие:
На этапе, когда существующие публичные данные находятся на грани разработки и исчерпания, как дальше извлекать недоступные данные, даже частные данные, является важным направлением для получения и расширения источников данных. Это ставит перед важной проблемой выбора доверия - выбираете ли вы систему выкупа контрактов крупной централизованной компании и продаете свои данные; или выбираете метод блокчейна, продолжаете держать IP данных в своих руках и четко понимаете через смарт-контракты: кто использует ваши данные, когда и с какой целью.
В то же время для обработки конфиденциальной информации вы можете использовать zk, TEE и другие методы, чтобы гарантировать, что ваши личные данные будут обрабатываться только машинами, которые хранят молчание и не будут утечены.
Возможно, пришло время бросить вызов традиционным отношениям трудовой эксплуатации. Вместо того чтобы искать дешевую рабочую силу по всему миру, как это делает Scale AI, лучше воспользоваться распределенными характеристиками блокчейна и позволить рабочей силе, разбросанной по всему миру, участвовать в внесении данных через открытые и прозрачные стимулы, гарантированные смарт-контрактами.
Для трудоемких задач, таких как разметка данных и оценка модели, использование Web3 DataFi более способствует разнообразию участников, чем централизованный подход к созданию данных фабрик, что также имеет долгосрочное значение для избежания предвзятости данных.
Как избежать трагедии "Фабрики кожи Цзяннань"? Естественно, мы должны использовать систему стимулов с четкими ценниками в смарт-контрактах, чтобы заменить темноту человеческой природы.
В условиях неизбежной деглобализации, как мы можем продолжать достигать низкозатратного географического арбитража? Очевидно, что открывать компании по всему миру стало сложнее, так почему бы не обойти барьеры старого мира и не принять метод расчетов на блокчейне?
"Посредники, зарабатывающие на разнице в ценах", — это вечная проблема как для стороны предложения, так и для стороны спроса. Вместо того чтобы позволять централизованной компании по обработке данных действовать в качестве посредника, лучше создать платформу на блокчейне, через открытый рынок, такой как Таобао, чтобы стороны предложения и спроса на данные могли соединяться более прозрачно и эффективно.
С развитием экосистемы ИИ на блокчейне спрос на данные в цепочке станет более активным, сегментированным и разнообразным. Только децентрализованный рынок сможет эффективно переработать этот спрос и превратить его в экологическое процветание.
Для розничных инвесторов DataFi также является самым децентрализованным проектом ИИ, который наиболее способствует участию обычных розничных инвесторов.
Хотя появление инструментов ИИ снизило порог обучения в определенной степени, и изначальная цель децентрализованного ИИ заключается в разрыве текущей монополии гигантов в бизнесе ИИ; тем не менее, необходимо признать, что многие текущие проекты не очень доступны для розничных инвесторов без технического фона - участие в майнинге децентрализованных вычислительных сетей часто связано с дорогостоящими начальными инвестициями в оборудование, а технический порог рынка моделей всегда может легко оттолкнуть обычных участников.
В отличие от этого, это одна из немногих возможностей, которые обычные пользователи могут использовать в революции ИИ. Web3 позволяет вам участвовать в этом, выполняя различные простые задачи, включая предоставление данных, маркировку и оценку моделей на основе интуиции и инстинкта человеческого мозга, или дальнейшее использование инструментов ИИ для выполнения некоторых простых творений, участвовать в сделках с данными и т.д. Для опытных пользователей партии Мао уровень сложности в основном равен нулю.
Потенциальные проекты Web3 DataFi
Где идут деньги, там и направление. Помимо того, что Scale AI получила инвестиции в размере 14,3 миллиарда долларов от Meta и акции Palantir выросли более чем в 5 раз за один год в мире Web2, DataFi также показала очень хорошие результаты в финансировании Web3. Здесь мы кратко представляем эти проекты.
Sahara AI, @SaharaLabsAI, привлек 49 миллионов долларов
Конечной целью Sahara AI является создание децентрализованной суперинфраструктуры ИИ и торгового рынка. Первым сектором, который будет протестирован, является AI Data. Публичная бета-версия его DSP (Data Services Platform) будет запущена 22 июля. Пользователи могут получать токен-вознаграждения, внося данные, участвуя в маркировке данных и других задачах.
Ссылка: app.saharaai.com
Да, @yupp_ai собрала 33 миллиона долларов
Yupp — это платформа обратной связи для моделей ИИ, которая собирает отзывы пользователей о результатах моделей. Основная задача заключается в том, что пользователи могут сравнивать результаты разных моделей для одного и того же запроса, а затем выбирать тот, который они считают лучшим. Завершение задачи позволяет заработать очки Yupp, которые можно обменять на фиатные стейблкоины, такие как USDC.
Ссылка:
Vana, @vana, собрала 23 миллиона долларов
Vana сосредотачивается на преобразовании личных данных пользователей (, таких как активности в социальных сетях, история просмотров и т. д. ) в монетизируемые цифровые активы. Пользователи могут авторизовать загрузку своих личных данных в соответствующий пул ликвидности данных (DLP) в DataDAOs. Эти данные будут объединены и использованы для участия в задачах, таких как обучение AI моделей, а пользователи также получат соответствующие токен-вознаграждения.
Ссылка:
Chainbase, @ChainbaseHQ, привлек 16,5 миллиона долларов
Бизнес Chainbase сосредоточен на данных в цепочке и в настоящее время охватывает более 200 блокчейнов, превращая действия в цепочке в структурированные, проверяемые и монетизируемые данные для разработки dApp. Бизнес Chainbase в основном осуществляется через многосетевую индексацию и другие методы, а данные обрабатываются с помощью его системы Manuscript и модели Theia AI. Обычные пользователи в настоящее время не очень вовлечены.
Sapien, @JoinSapien, собрал 15,5 миллиона долларов
Sapien ставит перед собой цель преобразовать человеческие знания в качественные данные для обучения ИИ в большом масштабе. Любой может выполнять аннотацию данных на платформе и обеспечивать качество данных через верификацию со стороны коллег. В то же время пользователям предлагается строить долгосрочную репутацию или делать обязательства через стекинг, чтобы зарабатывать больше наград.
Ссылка:
Prisma X, @PrismaXai, привлекла 11 миллионов долларов
Prisma X хочет стать открытым координационным слоем для роботов, где сбор физических данных является ключевым. Этот проект сейчас находится на ранних стадиях. Согласно недавно выпущенному белому документу, участие может включать инвестиции в роботов для сбора данных, удаленную работу с роботизированными данными и т.д. В настоящее время открыт тест на основе белого документа, и вы можете участвовать, чтобы заработать баллы.
Ссылка:
Masa, @getmasafi, собрал 8,9 миллиона долларов
Masa является одним из ведущих проектов подсетей в экосистеме Bittensor и в настоящее время управляет подсетью данных № 42 и подсетью агентов № 59. Подсеть данных стремится предоставить доступ к данным в реальном времени. В настоящее время майнеры в основном собирают данные в реальном времени с X/Twitter с помощью аппаратного обеспечения TEE. Для обычных пользователей сложность и стоимость участия относительно высоки.
Irys, @irys_xyz, собрала 8,7 миллиона долларов
Irys сосредоточен на программируемом хранении данных и вычислениях, стремясь предоставить эффективные и недорогие решения для ИИ, децентрализованных приложений (dApps) и других приложений, требующих большого объема данных. Что касается вклада в данные, то обычные пользователи в настоящее время не могут участвовать в значительной степени, но есть множество мероприятий для участия на текущем этапе тестовой сети.
Ссылка:
ORO, @getoro_xyz, собрал 6 миллионов долларов
Что ORO хочет сделать, так это дать возможность обычным людям участвовать в вкладе в ИИ. Методы поддержки включают: 1. Привязка вашей личной учетной записи для внесения личных данных, включая социальные аккаунты, данные о здоровье, учетные записи электронной коммерции и финансовые счета; 2. Завершение задач по данным. Тестовая сеть сейчас в сети, и вы можете участвовать.
Ссылка: app.getoro.xyz
Gata, @Gata_xyz, собрала 4 миллиона долларов
Позиционируясь как децентрализованный слой данных, Gata в настоящее время имеет три ключевых продукта для участия: 1. Data Agent: серия AI-агентов, которые могут автоматически запускать и обрабатывать данные, как только пользователь откроет веб-страницу; 2. AII-in-one Chat: механизм, аналогичный оценке модели Yupp, для получения вознаграждений; 3. GPT-to-Earn: браузерное расширение, которое собирает данные разговоров пользователей на ChatGPT.
Ссылка:
Как вы смотрите на эти текущие проекты?
В настоящее время барьеры для входа в эти проекты, как правило, не высоки, но необходимо признать, что как только накапливаются пользователи и экологическая привязка, преимущества платформы будут быстро накапливаться. Поэтому на ранних стадиях усилия следует сосредоточить на стимулах и пользовательском опыте. Только привлекая достаточное количество пользователей, можно создать бизнес больших данных.
Однако, как трудоемкие проекты, этим платформам данных также следует учитывать, как управлять трудозатратами и обеспечивать качество выходных данных, привлекая при этом рабочую силу. В конце концов, распространенной проблемой многих проектов Web3 является то, что большинство пользователей на платформе являются просто безжалостными наживателями. Они часто жертвуют качеством ради краткосрочной выгоды. Если им позволят стать основными пользователями платформы, плохие деньги неизбежно вытеснят хорошие деньги, и в конечном итоге качество данных не сможет быть гарантировано, и покупателей нельзя будет привлечь. В настоящее время мы видим, что такие проекты, как Sahara и Sapien, подчеркивают качество данных и стремятся установить долгосрочные и здоровые кооперативные отношения с трудом на платформе.
Кроме того, отсутствие прозрачности является еще одной проблемой текущих проектов в цепочке. Действительно, невозможный треугольник блокчейна заставил многие проекты пойти по пути "централизация ведет к децентрализации" на стадии старта. Но теперь все больше и больше проектов в цепочке создают у людей впечатление "старых Web2 проектов в оболочке Web3" - есть очень мало публичных данных, которые можно отслеживать в цепочке, и даже дорожная карта трудно показывает долгосрочную решимость к открытости и прозрачности. Это, безусловно, токсично для долгосрочного здорового развития Web3 DataFi, и мы также надеемся, что больше проектов всегда будут сохранять свои первоначальные намерения и ускорять темпы открытости и прозрачности.
В конечном итоге путь массового принятия DataFi также следует разделить на две части: первая — привлечь достаточное количество участников toC для присоединения к сети, сформировав новую силу для сбора/генерации данных и потребителей ИИ-экономики, создавая экологический замкнутый цикл; вторая — получить признание от текущих ведущих компаний toB. В конце концов, в краткосрочной перспективе они являются основным источником крупных заказов на данные благодаря своим глубоким карманам. В этом отношении мы также видим, что Sahara AI, Vana и другие добились хорошего прогресса.
Заключение
Более фаталистично, DataFi заключается в использовании человеческого интеллекта для воспитания машинного интеллекта в долгосрочной перспективе, при этом используя смарт-контракты в качестве контракта для обеспечения прибыльности человеческого интеллектуального труда и в конечном итоге получения обратной связи от машинного интеллекта.
Если вы беспокоитесь о неопределенности эпохи ИИ и если у вас все еще есть блокчейн-идеи среди взлетов и падений в мире криптовалют, то следовать по стопам группы капитальных гигантов и присоединиться к DataFi — хороший выбор, чтобы идти в ногу со временем.