Эволюция индексирования данных Блокчейн: от оригинальных Узлов до полностью цепочечного базы данных с поддержкой ИИ
1. Введение
С момента появления первых приложений Блокчейн в 2017 году децентрализованные приложения (dApp) активно развиваются, охватывая такие области, как финансы, игры и социальные сети. С учетом постоянного прогресса в отрасли мы не можем не задуматься: откуда на самом деле берутся данные, на которых основаны эти dApp?
В 2024 году искусственный интеллект и Web3 станут центром внимания. В области ИИ данные подобны источнику жизни, постоянно питая рост и эволюцию системы. Без поддержки огромного объема качественных данных даже самые изящные алгоритмы ИИ не смогут проявить свою истинную интеллектуальность и эффективность.
В данной статье будет подробно рассмотрен процесс развития доступности данных в Блокчейне, проанализирована эволюция технологий индексирования данных и проведено сравнение основных протоколов, таких как The Graph, Chainbase и Space and Time, в аспектах обслуживания данных и архитектуры продуктов, с особым вниманием к тому, как последние два из них используют технологии ИИ для предоставления инновационных услуг.
2. Сложность и простота индексирования данных: от узла блокчейна до полной базы данных цепочки
2.1 Источник данных: Узел Блокчейна
Блокчейн по своей сути является децентрализованной распределенной книгой, которую совместно поддерживают множество узлов. Каждый узел хранит полную копию данных Блокчейн, обеспечивая децентрализованный характер сети. Однако обычные пользователи, создающие и поддерживающие узлы, сталкиваются со многими трудностями, им нужны не только профессиональные навыки, но и высокие затраты на оборудование и пропускную способность. Кроме того, возможности запросов обычных узлов ограничены, что затрудняет удовлетворение потребностей разработчиков.
Для решения этой проблемы появились провайдеры узлов RPC. Они несут затраты на эксплуатацию узлов и предоставляют пользователям доступ к данным через RPC-конечные точки. Хотя общие RPC-конечные точки бесплатны, они имеют ограничения по скорости; частные RPC-конечные точки имеют лучшую производительность, но неэффективны для сложных запросов и трудно масштабируются между цепями. Тем не менее, стандартизированные API-интерфейсы провайдеров узлов значительно снизили порог доступа пользователей к данным в блокчейне.
2.2 Анализ данных: от исходных данных до пригодных данных
Данные, предоставляемые Узлами Блокчейна, обычно проходят шифрование и кодирование, и их непосредственное использование для обычных пользователей и разработчиков является довольно сложным. Поэтому анализ данных становится ключевым этапом, который преобразует сложные исходные данные в формат, удобный для понимания и работы, что значительно повышает их доступность.
2.3 Эволюция индексатора данных
С увеличением объема данных Блокчейн, потребность в индексаторах данных становится все более актуальной. Индексаторы организуют данные на цепочке и сохраняют их в базе данных, что облегчает их поиск. Они предоставляют унифицированный интерфейс запросов, позволяя разработчикам быстро и точно извлекать необходимую информацию с помощью стандартизированного языка запросов (, такого как GraphQL ).
Разные типы индексаторов имеют свои особенности:
Полный узел индексатор: извлекает данные непосредственно из полного узла, обеспечивая целостность данных, но требует значительных ресурсов.
Легковесный индексатор: полагается на полные узлы для получения данных по запросу, снижая требования к хранению, но возможно увеличивая время запроса.
Специальный индексатор: оптимизирован для определенных типов данных или Блокчейн, таких как данные NFT или сделки DeFi.
Аггрегатор индексов: извлечение данных из нескольких Блокчейн и источников, включая оффлайн информацию, для удобства многосетевых приложений.
В настоящее время требования к хранению архивных узлов Эфириума достигли уровня нескольких ТБ. Столкнувшись с таким объемом данных, основные протоколы индексирования не только поддерживают многосетевую индексацию, но и настраивают фреймы анализа данных под различные потребности приложений, такие как "Подграф" The Graph (Subgraph).
По сравнению с традиционными RPC-точками, индексаторы значительно увеличили эффективность индексирования и запроса данных. Они поддерживают сложные запросы, фильтрацию данных и агрегированную аналитику, а также могут интегрировать источники данных между цепочками. Запускаясь в распределенной среде, индексаторы обеспечивают большую безопасность и производительность, снижая риск сбоев.
2.4 Полная цепочка данных: выравнивание по приоритету потока
С учетом того, что требования к приложениям становятся все более сложными, стандартизированные API сложно удовлетворить разнообразные запросы, такие как кросс-чейн доступ или отображение данных вне цепи. Метод "приоритета потоков" в современных дата-пайплайнах предлагает новые идеи для обработки данных в реальном времени, позволяя организациям мгновенно реагировать на данные и принимать решения.
Поставщики услуг данных Блокчейн также развиваются в направлении создания потоков данных. Традиционные поставщики индексирующих услуг запускают продукты потоковых данных в реальном времени, такие как Substreams от The Graph и Mirror от Goldsky. Новые поставщики, такие как Chainbase и SubSquid, предлагают озера данных в реальном времени на основе Блокчейн.
Эти услуги направлены на удовлетворение потребности в实时解析 Блокчейн транзакций и предоставлении полного запроса. Рассматривая данные Блокчейн как поток данных, а не как конечный вывод, мы можем настраивать высокопроизводительные наборы данных для различных бизнес-сценариев.
3. AI + База данных? Глубокое сравнение The Graph, Chainbase и Space and Time
3.1 Граф
Сеть The Graph предоставляет многосетевые услуги по индексации и запросу данных через децентрализованные узлы. Ее основной продукт - это рынок выполнения запросов данных и рынок кэширования индексов данных, которые обслуживают запросы пользователей. Сеть The Graph состоит из четырех ролей: индексатор, куратор, делегатор и разработчик, которые обеспечивают функционирование системы через экономические стимулы.
Экосистема The Graph активно принимает технологии ИИ. Инструменты, разработанные Semiotic Labs, такие как AutoAgora, Allocation Optimizer и AgentC, улучшили производительность системы в области ценообразования, распределения ресурсов и пользовательского опыта. Применение этих инструментов позволило The Graph повысить уровень интеллекта и удобство использования.
3.2 Chainbase
Chainbase — это сеть данных по всему Блокчейн, объединяющая данные из нескольких цепочек на одной платформе. Его уникальные функции включают:
Реальный дата-озеро: предоставляет мгновенный доступ к потокам данных Блокчейн
Двухцепочная архитектура: основана на Eigenlayer AVS для построения исполняющего слоя, параллельно с алгоритмом консенсуса CometBFT
Инновационный стандарт формата данных: введение "manuscripts" для оптимизации структуры данных
Модель криптомира: сочетание технологий AI модели для создания AI модели, понимающей и предсказывающей交易 в Блокчейн.
AI-модель Theia от Chainbase является её ключевым акцентом. Theia основана на модели DORA от NVIDIA, комбинируя анализ данных на блокчейне и вне его, используя криптографические методы, и реагируя с помощью причинно-следственного вывода, предоставляя пользователям интеллектуальные данные.
3.3 Пространство и Время
Space and Time (SxT) нацелена на создание проверяемого вычислительного слоя, расширяющего нулевые доказательства на децентрализованных хранилищах данных. Их ключевая технология Proof of SQL обеспечивает защиту от подделки и проверяемость SQL-запросов, предоставляя основу для применения данных на блокчейне в отраслях с высокими требованиями к надежности данных.
SxT сотрудничает с лабораторией инноваций Microsoft AI для разработки инструментов генеративного ИИ, позволяющих пользователям обрабатывать данные Блокчейн с помощью обработки естественного языка. В Space and Time Studio ИИ может автоматически преобразовывать естественный язык в SQL и выполнять запросы.
Заключение и перспективы
Технология индексирования данных Блокчейн прошла путь от первоначального Узел источника данных, через развитие анализа данных и индексаторов, в конечном итоге эволюционируя в полностью цепочечные данные, поддерживаемые ИИ, пройдя процесс постепенного совершенствования. Эти достижения в технологиях не только повысили эффективность и точность доступа к данным, но и принесли интеллектуальный пользовательский опыт.
В будущем, с развитием новых технологий, таких как технологии ИИ и доказательства с нулевым разглашением, услуги данных блокчейна будут становиться все более интеллектуальными и безопасными. В качестве инфраструктуры услуги данных блокчейна продолжат оказывать мощную поддержку инновациям в отрасли.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
12 Лайков
Награда
12
6
Поделиться
комментарий
0/400
ChainDoctor
· 19ч назад
Зачем было говорить? Данные просто могут использоваться в качестве топлива.
Посмотреть ОригиналОтветить0
DataChief
· 19ч назад
AI интеграция Блокчейн? Я завидую.
Посмотреть ОригиналОтветить0
ZeroRushCaptain
· 19ч назад
Пф, столько лет прошло, а они снова роют ямы под данными? Всё тот же старый подход, только в новой упаковке!
Посмотреть ОригиналОтветить0
MetaverseLandlady
· 19ч назад
Скоро 2025 год, данные в блокчейне взрывообразно неконтролируемы.
Эволюция индексации данных Блокчейн: от Узла к AI-уполномоченной базе данных всей цепи
Эволюция индексирования данных Блокчейн: от оригинальных Узлов до полностью цепочечного базы данных с поддержкой ИИ
1. Введение
С момента появления первых приложений Блокчейн в 2017 году децентрализованные приложения (dApp) активно развиваются, охватывая такие области, как финансы, игры и социальные сети. С учетом постоянного прогресса в отрасли мы не можем не задуматься: откуда на самом деле берутся данные, на которых основаны эти dApp?
В 2024 году искусственный интеллект и Web3 станут центром внимания. В области ИИ данные подобны источнику жизни, постоянно питая рост и эволюцию системы. Без поддержки огромного объема качественных данных даже самые изящные алгоритмы ИИ не смогут проявить свою истинную интеллектуальность и эффективность.
В данной статье будет подробно рассмотрен процесс развития доступности данных в Блокчейне, проанализирована эволюция технологий индексирования данных и проведено сравнение основных протоколов, таких как The Graph, Chainbase и Space and Time, в аспектах обслуживания данных и архитектуры продуктов, с особым вниманием к тому, как последние два из них используют технологии ИИ для предоставления инновационных услуг.
2. Сложность и простота индексирования данных: от узла блокчейна до полной базы данных цепочки
2.1 Источник данных: Узел Блокчейна
Блокчейн по своей сути является децентрализованной распределенной книгой, которую совместно поддерживают множество узлов. Каждый узел хранит полную копию данных Блокчейн, обеспечивая децентрализованный характер сети. Однако обычные пользователи, создающие и поддерживающие узлы, сталкиваются со многими трудностями, им нужны не только профессиональные навыки, но и высокие затраты на оборудование и пропускную способность. Кроме того, возможности запросов обычных узлов ограничены, что затрудняет удовлетворение потребностей разработчиков.
Для решения этой проблемы появились провайдеры узлов RPC. Они несут затраты на эксплуатацию узлов и предоставляют пользователям доступ к данным через RPC-конечные точки. Хотя общие RPC-конечные точки бесплатны, они имеют ограничения по скорости; частные RPC-конечные точки имеют лучшую производительность, но неэффективны для сложных запросов и трудно масштабируются между цепями. Тем не менее, стандартизированные API-интерфейсы провайдеров узлов значительно снизили порог доступа пользователей к данным в блокчейне.
2.2 Анализ данных: от исходных данных до пригодных данных
Данные, предоставляемые Узлами Блокчейна, обычно проходят шифрование и кодирование, и их непосредственное использование для обычных пользователей и разработчиков является довольно сложным. Поэтому анализ данных становится ключевым этапом, который преобразует сложные исходные данные в формат, удобный для понимания и работы, что значительно повышает их доступность.
2.3 Эволюция индексатора данных
С увеличением объема данных Блокчейн, потребность в индексаторах данных становится все более актуальной. Индексаторы организуют данные на цепочке и сохраняют их в базе данных, что облегчает их поиск. Они предоставляют унифицированный интерфейс запросов, позволяя разработчикам быстро и точно извлекать необходимую информацию с помощью стандартизированного языка запросов (, такого как GraphQL ).
Разные типы индексаторов имеют свои особенности:
В настоящее время требования к хранению архивных узлов Эфириума достигли уровня нескольких ТБ. Столкнувшись с таким объемом данных, основные протоколы индексирования не только поддерживают многосетевую индексацию, но и настраивают фреймы анализа данных под различные потребности приложений, такие как "Подграф" The Graph (Subgraph).
По сравнению с традиционными RPC-точками, индексаторы значительно увеличили эффективность индексирования и запроса данных. Они поддерживают сложные запросы, фильтрацию данных и агрегированную аналитику, а также могут интегрировать источники данных между цепочками. Запускаясь в распределенной среде, индексаторы обеспечивают большую безопасность и производительность, снижая риск сбоев.
2.4 Полная цепочка данных: выравнивание по приоритету потока
С учетом того, что требования к приложениям становятся все более сложными, стандартизированные API сложно удовлетворить разнообразные запросы, такие как кросс-чейн доступ или отображение данных вне цепи. Метод "приоритета потоков" в современных дата-пайплайнах предлагает новые идеи для обработки данных в реальном времени, позволяя организациям мгновенно реагировать на данные и принимать решения.
Поставщики услуг данных Блокчейн также развиваются в направлении создания потоков данных. Традиционные поставщики индексирующих услуг запускают продукты потоковых данных в реальном времени, такие как Substreams от The Graph и Mirror от Goldsky. Новые поставщики, такие как Chainbase и SubSquid, предлагают озера данных в реальном времени на основе Блокчейн.
Эти услуги направлены на удовлетворение потребности в实时解析 Блокчейн транзакций и предоставлении полного запроса. Рассматривая данные Блокчейн как поток данных, а не как конечный вывод, мы можем настраивать высокопроизводительные наборы данных для различных бизнес-сценариев.
3. AI + База данных? Глубокое сравнение The Graph, Chainbase и Space and Time
3.1 Граф
Сеть The Graph предоставляет многосетевые услуги по индексации и запросу данных через децентрализованные узлы. Ее основной продукт - это рынок выполнения запросов данных и рынок кэширования индексов данных, которые обслуживают запросы пользователей. Сеть The Graph состоит из четырех ролей: индексатор, куратор, делегатор и разработчик, которые обеспечивают функционирование системы через экономические стимулы.
Экосистема The Graph активно принимает технологии ИИ. Инструменты, разработанные Semiotic Labs, такие как AutoAgora, Allocation Optimizer и AgentC, улучшили производительность системы в области ценообразования, распределения ресурсов и пользовательского опыта. Применение этих инструментов позволило The Graph повысить уровень интеллекта и удобство использования.
3.2 Chainbase
Chainbase — это сеть данных по всему Блокчейн, объединяющая данные из нескольких цепочек на одной платформе. Его уникальные функции включают:
AI-модель Theia от Chainbase является её ключевым акцентом. Theia основана на модели DORA от NVIDIA, комбинируя анализ данных на блокчейне и вне его, используя криптографические методы, и реагируя с помощью причинно-следственного вывода, предоставляя пользователям интеллектуальные данные.
3.3 Пространство и Время
Space and Time (SxT) нацелена на создание проверяемого вычислительного слоя, расширяющего нулевые доказательства на децентрализованных хранилищах данных. Их ключевая технология Proof of SQL обеспечивает защиту от подделки и проверяемость SQL-запросов, предоставляя основу для применения данных на блокчейне в отраслях с высокими требованиями к надежности данных.
SxT сотрудничает с лабораторией инноваций Microsoft AI для разработки инструментов генеративного ИИ, позволяющих пользователям обрабатывать данные Блокчейн с помощью обработки естественного языка. В Space and Time Studio ИИ может автоматически преобразовывать естественный язык в SQL и выполнять запросы.
Заключение и перспективы
Технология индексирования данных Блокчейн прошла путь от первоначального Узел источника данных, через развитие анализа данных и индексаторов, в конечном итоге эволюционируя в полностью цепочечные данные, поддерживаемые ИИ, пройдя процесс постепенного совершенствования. Эти достижения в технологиях не только повысили эффективность и точность доступа к данным, но и принесли интеллектуальный пользовательский опыт.
В будущем, с развитием новых технологий, таких как технологии ИИ и доказательства с нулевым разглашением, услуги данных блокчейна будут становиться все более интеллектуальными и безопасными. В качестве инфраструктуры услуги данных блокчейна продолжат оказывать мощную поддержку инновациям в отрасли.