الكأس المقدس للذكاء الاصطناعي في التشفير: استكشافات متقدمة في التدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، تُعدّ عملية تدريب النموذج هي المرحلة الأكثر استهلاكًا للموارد، والأعلى من حيث متطلبات التقنية، حيث تحدد مباشرة الحد الأقصى لقدرة النموذج وفعالية تطبيقه الفعلية. بالمقارنة مع الاستدعاء الخفيف في مرحلة الاستدلال، تتطلب عملية التدريب استثمارًا مستمرًا في قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "صناعة ثقيلة" حقيقية في بناء أنظمة الذكاء الاصطناعي. من حيث نمط الهيكل، يمكن تقسيم أساليب التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، وأخيرًا التدريب اللامركزي الذي يتم مناقشته في هذه المقالة.
تعتبر التدريب المركزية الطريقة التقليدية الأكثر شيوعًا، حيث يتم إكمال جميع عمليات التدريب بواسطة مؤسسة واحدة داخل تجمعات عالية الأداء المحلية، من الأجهزة، والبرمجيات الأساسية، ونظام جدولة التجمع، إلى جميع مكونات إطار التدريب، حيث يتم تنسيق تشغيلها بواسطة نظام تحكم موحد. تتيح هذه البنية المعمارية المتعمقة التآزر مشاركة الذاكرة، ومزامنة التدرجات، وآليات التحمل بكفاءة مثلى، مما يجعلها مناسبة جدًا لتدريب نماذج كبيرة مثل GPT وGemini، ولها فوائد مثل الكفاءة العالية والموارد القابلة للتحكم، ولكنها في الوقت نفسه تعاني من مشاكل احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقاط الفردية.
تدريب موزع هو الطريقة السائدة في تدريب النماذج الكبيرة الحالية، حيث يتمثل جوهرها في تقسيم مهمة تدريب النموذج ثم توزيعها على عدة آلات لتنفيذها بشكل متعاون، وذلك لتجاوز اختناقات حساب وتخزين الآلة الواحدة. على الرغم من أنها تتمتع بخصائص "اللامركزية" من الناحية الفيزيائية، إلا أن السيطرة على الجدولة والمزامنة لا تزال من قبل جهة مركزية، وغالبًا ما تعمل في بيئة شبكة محلية عالية السرعة، من خلال تقنية ناقل الاتصال عالي السرعة NVLink، حيث يقوم العقد الرئيسي بتنسيق المهام الفرعية بشكل موحد. تشمل الطرق السائدة:
التوازي البياني: كل عقدة تدرب معلمات بيانات مختلفة تتشارك في وزن النموذج، يجب أن تتطابق.
التوازي النموذجي: نشر أجزاء مختلفة من النموذج على عقد مختلفة لتحقيق قابلية توسيع قوية
الأنابيب المتوازية: تنفيذ متسلسل على مراحل، مما يزيد من معدل الإنتاج.
التوازي المتجه: تقسيم دقيق لحساب المصفوفة، مما يعزز درجة التوازي
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، شبيه بكيفية توجيه نفس المدير عن بعد لعدة موظفين في "مكاتب" للتعاون في إكمال المهام. في الوقت الحالي، يتم تدريب جميع النماذج الكبيرة الرئيسية تقريباً بهذه الطريقة.
تمثل التدريب اللامركزي مسارًا مستقبليًا يتمتع بقدر أكبر من الانفتاح وخصائص مقاومة الرقابة. تتمثل الميزات الأساسية في: عدة نقاط غير موثوقة تتعاون لإكمال مهام التدريب دون منسق مركزي، عادةً من خلال بروتوكولات تحفز توزيع المهام والتعاون، وتستخدم آليات التحفيز المشفرة لضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي تواجه هذا النموذج:
صعوبة تنسيق الأجهزة المتباينة والتقسيم: صعوبة تنسيق الأجهزة المتباينة، وكفاءة تقسيم المهام منخفضة
اختناق كفاءة الاتصال: الاتصال الشبكي غير مستقر، واختناق مزامنة التدرج واضح
نقص التنفيذ الموثوق: نقص بيئة تنفيذ موثوقة، مما يجعل من الصعب التحقق مما إذا كانت العقدة تشارك فعلاً في الحساب
عدم وجود تنسيق موحد: لا يوجد وحدة تحكم مركزية، توزيع المهام، وآلية التراجع عن الأخطاء معقدة
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين في جميع أنحاء العالم، يساهمون كل منهم بقوة الحساب في تدريب النموذج بشكل متعاون، لكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال يمثل تحديًا هندسيًا منهجيًا، يتضمن بنية النظام، بروتوكولات الاتصال، أمان التشفير، الآليات الاقتصادية، والتحقق من النموذج على عدة مستويات، لكن إمكانية "التعاون الفعال + تحفيز النزاهة + نتائج صحيحة" لا تزال في مرحلة استكشاف النماذج الأولية المبكرة.
التعلم الفيدرالي كشكل انتقالي بين التوزيع واللامركزية، يؤكد على الاحتفاظ بالبيانات محليًا، وتجميع معلمات النموذج مركزيًا، وهو مناسب للسيناريوهات التي تركز على الامتثال للخصوصية. يتمتع التعلم الفيدرالي ببنية هندسية للتدريب الموزع وقدرة على التعاون المحلي، بالإضافة إلى ميزة توزيع البيانات لتدريب غير مركزي، ولكنه لا يزال يعتمد على جهة تنسيق موثوقة، وليس لديه خصائص مفتوحة تمامًا ومقاومة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سيناريوهات الامتثال للخصوصية، حيث تكون المهام التدريبية، وبنية الثقة، وآلية الاتصال معتدلة نسبيًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.
اللامركزية تدريب الحدود، الفرص والواقع المسارات
من منظور نمط التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، وارتفاع متطلبات الموارد، أو صعوبة التعاون، فإنه غير مناسب بطبيعته لإكمال المهام بكفاءة بين العقد المتنوعة وغير الموثوقة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالباً على ذاكرة وصول عشوائي عالية، زمن استجابة منخفض وعرض نطاق عالي، مما يجعل من الصعب تقسيمها ومزامنتها بفعالية في الشبكات المفتوحة؛ كما أن المهام التي تتطلب خصوصية البيانات وقيود السيادة تكون مقيدة بالامتثال القانوني والقيود الأخلاقية، ولا يمكن مشاركتها بشكل مفتوح؛ بينما تفتقر المهام التي لا تملك أساساً للتحفيز التعاوني إلى دافع للمشاركة الخارجية. تشكل هذه الحدود معاً القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو فكرة زائفة. في الواقع، تظهر التدريب اللامركزي آفاق تطبيق واضحة في أنواع المهام الخفيفة الوزن، سهلة التوازي، والقابلة للتحفيز. بما في ذلك، على سبيل المثال لا الحصر: ضبط LoRA، مهام التدريب اللاحقة المتوافقة مع السلوك، تدريب البيانات والتعليقات الجماعية، تدريب نماذج أساسية صغيرة قابلة للتحكم في الموارد، فضلاً عن سيناريوهات التدريب التعاوني بمشاركة الأجهزة الطرفية. تتميز هذه المهام عمومًا بارتفاع التوازي، وانخفاض الترابط، والقدرة على تحمل قوة الحوسبة غير المتجانسة، مما يجعلها مناسبة جدًا للتدريب التعاوني من خلال الشبكات P2P، بروتوكول Swarm، ومحسنات موزعة.
تحليل مشاريع التدريب الكلاسيكية اللامركزية
حاليًا، تشمل المشاريع الرائدة في مجال التدريب اللامركزي والتعلم الفيدرالي بشكل أساسي Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في البحث النظري الحالي؛ بينما مسارات التنفيذ لـ Gensyn وFlock.io واضحة نسبيًا، ويمكن رؤية تقدم هندسي أولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهياكل الهندسية وراء هذه المشاريع الخمسة، بالإضافة إلى مناقشة الفروق والعلاقات التكميلية بينها في نظام تدريب الذكاء الاصطناعي اللامركزي.
Prime Intellect: رائد شبكة التعلم المعزز التعاوني القابلة للتحقق من مسار التدريب
تسعى Prime Intellect إلى بناء شبكة تدريب AI لا تحتاج إلى الثقة، مما يسمح لأي شخص بالمشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في بناء نظام تدريب AI لامركزي قابل للتحقق وذو انفتاح وآلية تحفيزية كاملة من خلال ثلاثة وحدات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
هيكل بروتوكول Prime Intellect والقيمة الأساسية للوحدات الرئيسية
شرح آلية تدريب Prime Intellect الرئيسية
PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المفكك
PRIME-RL هو إطار عمل لتصميم وتنفيذ نماذج المهام مخصص لسيناريوهات التدريب اللامركزية من قبل Prime Intellect، مصمم خصيصًا للشبكات المتنوعة والمشاركة غير المتزامنة. يعتمد على التعلم المعزز كهدف رئيسي، حيث يفكك بشكل هيكلي عملية التدريب والاستدلال وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال دورة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات موحدة وآليات التحقق والتجميع. مقارنة بتدفقات التعلم المراقب التقليدية، يعد PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام ويضع الأساس لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.
TOPLOC: آلية التحقق من سلوك التدريب الخفيف الوزن
توبلوك هو آلية جوهرية للتحقق من التدريب اقترحها برايم إنتليكت، تُستخدم لتحديد ما إذا كان عقدة معينة قد أكملت فعلياً تعلم استراتيجية فعالة بناءً على بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد توبلوك على إعادة حساب النموذج بالكامل، بل يُكمل التحقق الهيكلي الخفيف من خلال تحليل "سلسلة المراقبة ↔ تحديث الاستراتيجية" بين المسارات المحلية المتسقة. إنه يحول لأول مرة مسارات السلوك أثناء عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الرئيسي لتحقيق توزيع مكافآت التدريب بدون ثقة، مما يوفر مسارًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية مركزية قابلة للتدقيق والتحفيز.
SHARDCAST: بروتوكول تجميع ونشر الوزن اللا متزامن
SHARDCAST هو بروتوكول نشر وتجميع الوزن المصمم بواسطة Prime Intellect، مُحسّن خصيصًا للبيئات الشبكية الحقيقية التي تتميز باللامركزية، والقيود على النطاق الترددي، وتغير حالة العقد. يجمع بين آلية نشر القيل والقال واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات عدم التزامن، لتحقيق تقارب تدريجي للوزن وتطور متعدد النسخ. مقارنةً بأساليب AllReduce المركزية أو المتزامنة، يعزز SHARDCAST بشكل ملحوظ قابلية التوسع وقدرة تحمل الأخطاء في التدريب اللامركزي، وهو الأساس الرئيسي لبناء إجماع وزن مستقر وتكرارات تدريب مستمرة.
OpenDiLoCo: إطار الاتصالات غير المتزامنة المتناثرة
OpenDiLoCo هو إطار عمل لتحسين الاتصالات تم تنفيذه بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحه DeepMind، وهو مصمم خصيصًا للتحديات الشائعة في التدريب اللامركزي مثل قيود النطاق الترددي، وتنوع الأجهزة وعدم استقرار العقد. يعتمد هيكله على التوازي البياني، من خلال بناء هياكل طوبولوجية نادرة مثل Ring وExpander وSmall-World، مما يتجنب تكاليف الاتصال العالية للتزامن العالمي، ويعتمد فقط على العقد المجاورة المحلية لإكمال تدريب النموذج التعاوني. من خلال دمج التحديثات غير المتزامنة وآلية تحمل الأخطاء، يتيح OpenDiLoCo لمستخدمي وحدات معالجة الرسوميات الاستهلاكية والأجهزة الطرفية المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل كبير إمكانية المشاركة في التدريب التعاوني العالمي، وهو أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.
PCCL: مكتبة الاتصالات التعاونية
PCCL هو مكتبة اتصالات خفيفة الوزن مصممة خصيصًا من قبل Prime Intellect لبيئة تدريب AI اللامركزية، وتهدف إلى حل اختناقات التكيف في المكتبات التقليدية في الأجهزة المتنوعة والشبكات منخفضة النطاق. يدعم PCCL البنية النادرة، وضغط التدرجات، والتزامن منخفض الدقة واستعادة النقاط، ويمكن تشغيله على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهو مكون أساسي يدعم القدرة على الاتصالات غير المتزامنة لبروتوكول OpenDiLoCo. لقد حسّن بشكل كبير من تحمل عرض النطاق الترددي لشبكة التدريب وتوافق الأجهزة، مما يمهد الطريق لبناء شبكة تدريب تعاونية مفتوحة حقًا وغير موثوقة.
شبكة Prime Intellect والحوافز وتوزيع الأدوار
قامت Prime Intellect ببناء شبكة تدريبية لا تحتاج إلى إذن، وقابلة للتحقق، وتتمتع بآلية حوافز اقتصادية، مما يتيح لأي شخص المشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعمل البروتوكول بناءً على ثلاث فئات من الأدوار الأساسية:
عقد التدريب: تنفيذ التدريب المحلي، تقديم تحديثات الوزن ومسارات المراقبة
عقدة التحقق: استخدام آلية TOPLOC للتحقق من صحة سلوك التدريب والمشاركة في حساب المكافآت وتجميع الاستراتيجيات
تتضمن العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان وتوزيع المكافآت، مما يشكل حلقة تحفيزية حول "سلوك التدريب الحقيقي".
INTELLECT-2:إصدار أول نموذج تدريب قابل للتحقق اللامركزية
أصدرت شركة Prime Intellect في مايو 2025 نموذج INTELLECT-2، وهو أول نموذج كبير لتعلم المعزز يتم تدريبه بواسطة عقد لامركزية غير موثوقة ومتزامنة، حيث يصل حجم المعلمات إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU متغايرة منتشرة عبر ثلاث قارات، باستخدام بنية متزامنة بالكامل، واستغرق التدريب أكثر من 400 ساعة، مما يظهر جدوى الشبكة التعاونية غير المتزامنة واستقرارها. هذا النموذج ليس مجرد اختراق في الأداء، بل هو أيضًا أول تطبيق نظامي لنموذج "التدريب هو الإجماع" الذي قدمته Prime Intellect. يدمج INTELLECT-2 بروتوكولات أساسية مثل PRIME-RL وTOPLOC وSHARDCAST، مما يدل على أن شبكة التدريب اللامركزية قد حققت لأول مرة فتح عملية التدريب، والتحقق، والحوافز الاقتصادية.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 13
أعجبني
13
5
مشاركة
تعليق
0/400
CoffeeNFTrader
· 07-19 09:06
ذهبت إلى المركز وتدربت في وحدة العزلة
شاهد النسخة الأصليةرد0
quiet_lurker
· 07-19 03:19
حفرة أخرى نسختها من التي لعبتها قبل عامين
شاهد النسخة الأصليةرد0
NftRegretMachine
· 07-16 14:18
بعيد عن الواقع، كيف يمكن أن نطمح إلى اللامركزية مع هذا الاستهلاك الكبير لقوة الحوسبة؟
شاهد النسخة الأصليةرد0
OnChainDetective
· 07-16 14:14
قوة الحوسبة مستثمرين كبار كلهم عناوين مؤسسات، سلسلة الأحداث خلفها مشبوهة جداً.
استكشاف تدريب الذكاء الاصطناعي اللامركزي: من التحديات التقنية إلى رواد الممارسة
الكأس المقدس للذكاء الاصطناعي في التشفير: استكشافات متقدمة في التدريب اللامركزي
في سلسلة القيمة الكاملة للذكاء الاصطناعي، تُعدّ عملية تدريب النموذج هي المرحلة الأكثر استهلاكًا للموارد، والأعلى من حيث متطلبات التقنية، حيث تحدد مباشرة الحد الأقصى لقدرة النموذج وفعالية تطبيقه الفعلية. بالمقارنة مع الاستدعاء الخفيف في مرحلة الاستدلال، تتطلب عملية التدريب استثمارًا مستمرًا في قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "صناعة ثقيلة" حقيقية في بناء أنظمة الذكاء الاصطناعي. من حيث نمط الهيكل، يمكن تقسيم أساليب التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، وأخيرًا التدريب اللامركزي الذي يتم مناقشته في هذه المقالة.
تعتبر التدريب المركزية الطريقة التقليدية الأكثر شيوعًا، حيث يتم إكمال جميع عمليات التدريب بواسطة مؤسسة واحدة داخل تجمعات عالية الأداء المحلية، من الأجهزة، والبرمجيات الأساسية، ونظام جدولة التجمع، إلى جميع مكونات إطار التدريب، حيث يتم تنسيق تشغيلها بواسطة نظام تحكم موحد. تتيح هذه البنية المعمارية المتعمقة التآزر مشاركة الذاكرة، ومزامنة التدرجات، وآليات التحمل بكفاءة مثلى، مما يجعلها مناسبة جدًا لتدريب نماذج كبيرة مثل GPT وGemini، ولها فوائد مثل الكفاءة العالية والموارد القابلة للتحكم، ولكنها في الوقت نفسه تعاني من مشاكل احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقاط الفردية.
تدريب موزع هو الطريقة السائدة في تدريب النماذج الكبيرة الحالية، حيث يتمثل جوهرها في تقسيم مهمة تدريب النموذج ثم توزيعها على عدة آلات لتنفيذها بشكل متعاون، وذلك لتجاوز اختناقات حساب وتخزين الآلة الواحدة. على الرغم من أنها تتمتع بخصائص "اللامركزية" من الناحية الفيزيائية، إلا أن السيطرة على الجدولة والمزامنة لا تزال من قبل جهة مركزية، وغالبًا ما تعمل في بيئة شبكة محلية عالية السرعة، من خلال تقنية ناقل الاتصال عالي السرعة NVLink، حيث يقوم العقد الرئيسي بتنسيق المهام الفرعية بشكل موحد. تشمل الطرق السائدة:
التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، شبيه بكيفية توجيه نفس المدير عن بعد لعدة موظفين في "مكاتب" للتعاون في إكمال المهام. في الوقت الحالي، يتم تدريب جميع النماذج الكبيرة الرئيسية تقريباً بهذه الطريقة.
تمثل التدريب اللامركزي مسارًا مستقبليًا يتمتع بقدر أكبر من الانفتاح وخصائص مقاومة الرقابة. تتمثل الميزات الأساسية في: عدة نقاط غير موثوقة تتعاون لإكمال مهام التدريب دون منسق مركزي، عادةً من خلال بروتوكولات تحفز توزيع المهام والتعاون، وتستخدم آليات التحفيز المشفرة لضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي تواجه هذا النموذج:
يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين في جميع أنحاء العالم، يساهمون كل منهم بقوة الحساب في تدريب النموذج بشكل متعاون، لكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال يمثل تحديًا هندسيًا منهجيًا، يتضمن بنية النظام، بروتوكولات الاتصال، أمان التشفير، الآليات الاقتصادية، والتحقق من النموذج على عدة مستويات، لكن إمكانية "التعاون الفعال + تحفيز النزاهة + نتائج صحيحة" لا تزال في مرحلة استكشاف النماذج الأولية المبكرة.
التعلم الفيدرالي كشكل انتقالي بين التوزيع واللامركزية، يؤكد على الاحتفاظ بالبيانات محليًا، وتجميع معلمات النموذج مركزيًا، وهو مناسب للسيناريوهات التي تركز على الامتثال للخصوصية. يتمتع التعلم الفيدرالي ببنية هندسية للتدريب الموزع وقدرة على التعاون المحلي، بالإضافة إلى ميزة توزيع البيانات لتدريب غير مركزي، ولكنه لا يزال يعتمد على جهة تنسيق موثوقة، وليس لديه خصائص مفتوحة تمامًا ومقاومة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سيناريوهات الامتثال للخصوصية، حيث تكون المهام التدريبية، وبنية الثقة، وآلية الاتصال معتدلة نسبيًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.
اللامركزية تدريب الحدود، الفرص والواقع المسارات
من منظور نمط التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، وارتفاع متطلبات الموارد، أو صعوبة التعاون، فإنه غير مناسب بطبيعته لإكمال المهام بكفاءة بين العقد المتنوعة وغير الموثوقة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالباً على ذاكرة وصول عشوائي عالية، زمن استجابة منخفض وعرض نطاق عالي، مما يجعل من الصعب تقسيمها ومزامنتها بفعالية في الشبكات المفتوحة؛ كما أن المهام التي تتطلب خصوصية البيانات وقيود السيادة تكون مقيدة بالامتثال القانوني والقيود الأخلاقية، ولا يمكن مشاركتها بشكل مفتوح؛ بينما تفتقر المهام التي لا تملك أساساً للتحفيز التعاوني إلى دافع للمشاركة الخارجية. تشكل هذه الحدود معاً القيود الواقعية الحالية للتدريب اللامركزي.
لكن هذا لا يعني أن التدريب اللامركزي هو فكرة زائفة. في الواقع، تظهر التدريب اللامركزي آفاق تطبيق واضحة في أنواع المهام الخفيفة الوزن، سهلة التوازي، والقابلة للتحفيز. بما في ذلك، على سبيل المثال لا الحصر: ضبط LoRA، مهام التدريب اللاحقة المتوافقة مع السلوك، تدريب البيانات والتعليقات الجماعية، تدريب نماذج أساسية صغيرة قابلة للتحكم في الموارد، فضلاً عن سيناريوهات التدريب التعاوني بمشاركة الأجهزة الطرفية. تتميز هذه المهام عمومًا بارتفاع التوازي، وانخفاض الترابط، والقدرة على تحمل قوة الحوسبة غير المتجانسة، مما يجعلها مناسبة جدًا للتدريب التعاوني من خلال الشبكات P2P، بروتوكول Swarm، ومحسنات موزعة.
تحليل مشاريع التدريب الكلاسيكية اللامركزية
حاليًا، تشمل المشاريع الرائدة في مجال التدريب اللامركزي والتعلم الفيدرالي بشكل أساسي Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في البحث النظري الحالي؛ بينما مسارات التنفيذ لـ Gensyn وFlock.io واضحة نسبيًا، ويمكن رؤية تقدم هندسي أولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهياكل الهندسية وراء هذه المشاريع الخمسة، بالإضافة إلى مناقشة الفروق والعلاقات التكميلية بينها في نظام تدريب الذكاء الاصطناعي اللامركزي.
Prime Intellect: رائد شبكة التعلم المعزز التعاوني القابلة للتحقق من مسار التدريب
تسعى Prime Intellect إلى بناء شبكة تدريب AI لا تحتاج إلى الثقة، مما يسمح لأي شخص بالمشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect في بناء نظام تدريب AI لامركزي قابل للتحقق وذو انفتاح وآلية تحفيزية كاملة من خلال ثلاثة وحدات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.
هيكل بروتوكول Prime Intellect والقيمة الأساسية للوحدات الرئيسية
شرح آلية تدريب Prime Intellect الرئيسية
PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المفكك
PRIME-RL هو إطار عمل لتصميم وتنفيذ نماذج المهام مخصص لسيناريوهات التدريب اللامركزية من قبل Prime Intellect، مصمم خصيصًا للشبكات المتنوعة والمشاركة غير المتزامنة. يعتمد على التعلم المعزز كهدف رئيسي، حيث يفكك بشكل هيكلي عملية التدريب والاستدلال وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال دورة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات موحدة وآليات التحقق والتجميع. مقارنة بتدفقات التعلم المراقب التقليدية، يعد PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام ويضع الأساس لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.
TOPLOC: آلية التحقق من سلوك التدريب الخفيف الوزن
توبلوك هو آلية جوهرية للتحقق من التدريب اقترحها برايم إنتليكت، تُستخدم لتحديد ما إذا كان عقدة معينة قد أكملت فعلياً تعلم استراتيجية فعالة بناءً على بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد توبلوك على إعادة حساب النموذج بالكامل، بل يُكمل التحقق الهيكلي الخفيف من خلال تحليل "سلسلة المراقبة ↔ تحديث الاستراتيجية" بين المسارات المحلية المتسقة. إنه يحول لأول مرة مسارات السلوك أثناء عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الرئيسي لتحقيق توزيع مكافآت التدريب بدون ثقة، مما يوفر مسارًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية مركزية قابلة للتدقيق والتحفيز.
SHARDCAST: بروتوكول تجميع ونشر الوزن اللا متزامن
SHARDCAST هو بروتوكول نشر وتجميع الوزن المصمم بواسطة Prime Intellect، مُحسّن خصيصًا للبيئات الشبكية الحقيقية التي تتميز باللامركزية، والقيود على النطاق الترددي، وتغير حالة العقد. يجمع بين آلية نشر القيل والقال واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات عدم التزامن، لتحقيق تقارب تدريجي للوزن وتطور متعدد النسخ. مقارنةً بأساليب AllReduce المركزية أو المتزامنة، يعزز SHARDCAST بشكل ملحوظ قابلية التوسع وقدرة تحمل الأخطاء في التدريب اللامركزي، وهو الأساس الرئيسي لبناء إجماع وزن مستقر وتكرارات تدريب مستمرة.
OpenDiLoCo: إطار الاتصالات غير المتزامنة المتناثرة
OpenDiLoCo هو إطار عمل لتحسين الاتصالات تم تنفيذه بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحه DeepMind، وهو مصمم خصيصًا للتحديات الشائعة في التدريب اللامركزي مثل قيود النطاق الترددي، وتنوع الأجهزة وعدم استقرار العقد. يعتمد هيكله على التوازي البياني، من خلال بناء هياكل طوبولوجية نادرة مثل Ring وExpander وSmall-World، مما يتجنب تكاليف الاتصال العالية للتزامن العالمي، ويعتمد فقط على العقد المجاورة المحلية لإكمال تدريب النموذج التعاوني. من خلال دمج التحديثات غير المتزامنة وآلية تحمل الأخطاء، يتيح OpenDiLoCo لمستخدمي وحدات معالجة الرسوميات الاستهلاكية والأجهزة الطرفية المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل كبير إمكانية المشاركة في التدريب التعاوني العالمي، وهو أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.
PCCL: مكتبة الاتصالات التعاونية
PCCL هو مكتبة اتصالات خفيفة الوزن مصممة خصيصًا من قبل Prime Intellect لبيئة تدريب AI اللامركزية، وتهدف إلى حل اختناقات التكيف في المكتبات التقليدية في الأجهزة المتنوعة والشبكات منخفضة النطاق. يدعم PCCL البنية النادرة، وضغط التدرجات، والتزامن منخفض الدقة واستعادة النقاط، ويمكن تشغيله على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهو مكون أساسي يدعم القدرة على الاتصالات غير المتزامنة لبروتوكول OpenDiLoCo. لقد حسّن بشكل كبير من تحمل عرض النطاق الترددي لشبكة التدريب وتوافق الأجهزة، مما يمهد الطريق لبناء شبكة تدريب تعاونية مفتوحة حقًا وغير موثوقة.
شبكة Prime Intellect والحوافز وتوزيع الأدوار
قامت Prime Intellect ببناء شبكة تدريبية لا تحتاج إلى إذن، وقابلة للتحقق، وتتمتع بآلية حوافز اقتصادية، مما يتيح لأي شخص المشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعمل البروتوكول بناءً على ثلاث فئات من الأدوار الأساسية:
تتضمن العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجميع الأوزان وتوزيع المكافآت، مما يشكل حلقة تحفيزية حول "سلوك التدريب الحقيقي".
INTELLECT-2:إصدار أول نموذج تدريب قابل للتحقق اللامركزية
أصدرت شركة Prime Intellect في مايو 2025 نموذج INTELLECT-2، وهو أول نموذج كبير لتعلم المعزز يتم تدريبه بواسطة عقد لامركزية غير موثوقة ومتزامنة، حيث يصل حجم المعلمات إلى 32B. تم تدريب نموذج INTELLECT-2 بالتعاون بين أكثر من 100 عقدة GPU متغايرة منتشرة عبر ثلاث قارات، باستخدام بنية متزامنة بالكامل، واستغرق التدريب أكثر من 400 ساعة، مما يظهر جدوى الشبكة التعاونية غير المتزامنة واستقرارها. هذا النموذج ليس مجرد اختراق في الأداء، بل هو أيضًا أول تطبيق نظامي لنموذج "التدريب هو الإجماع" الذي قدمته Prime Intellect. يدمج INTELLECT-2 بروتوكولات أساسية مثل PRIME-RL وTOPLOC وSHARDCAST، مما يدل على أن شبكة التدريب اللامركزية قد حققت لأول مرة فتح عملية التدريب، والتحقق، والحوافز الاقتصادية.