GM! تم تصميم نماذج LLMs اليوم لتكون واثقة. إنها تولد فقرات كاملة من الإجابات المنقحة دون أي طريقة مدمجة للتحقق من كل جزء.
إنه مثل الثقة في رجل مقنع حقًا لا يظهر أي إيصالات.
بدلاً من محاولة تحسين النموذج المثالي، يفترضون أن كل نموذج سيكون خاطئًا في بعض الأحيان. لذلك، يجعلونه قابلًا للتحقق من خلال التصميم.
أولاً، يقومون بتقسيم المخرجات إلى مطالب ذرية.
قل إن #AI يعطيك هذا البيان: "Bitcoin هي العملة الرقمية الأكثر انتشارًا، التي أنشأها ساتوشي ناكاموتو في عام 2008."
ميرا لا تأخذ ذلك كبيان واحد فقط. بل تقوم بتفكيكه إلى مزاعم منفصلة يمكن التحقق منها:
→ "بيتكوين هو أكثر العملات المشفرة احتفاظًا بها"
→ "تم إنشاء البيتكوين بواسطة ساتوشي ناكاموتو"
→ "تم إنشاء البيتكوين في عام 2008"
يمكن التحقق من كل واحد من هؤلاء بشكل مستقل من قبل الشبكة. قد يكون أحدها ذاتيًا مثل كيفية تعريفك لأكثر الآراء شيوعًا، وآخر هو حقيقة مثل من قام بإنشائه، وآخر يتعلق بالوقت مثل متى تم صنعه.
هذه هي قوة الثنائية، تحويل مخرجات الذكاء الاصطناعي الضبابية إلى ادعاءات واضحة وقابلة للتحقق لا تعتمد على اهتزازات النموذج.
ثم يرسلون تلك المطالبات عبر شبكة لامركزية من المدققين لكن لا يرى أي عقدة المدخل الكامل. هذا هو التحقق الموزع. كل عقدة تتحقق من جزء، مما يحافظ على الخصوصية ويضمن عدم اختناق الثقة.
الآن، كيف تجعل هؤلاء المدققين صادقين؟ → اجعلهم يراهنون.
كل عقد لديه مصلحة في اللعبة. إذا قام بالتحقق من هلوسة، يتم خصم جزء منه. هذه هي دليل التحقق، مما يحول الاستدلال إلى عمل اقتصادي حقيقي، وليس مجرد مضاربة.
وأخيرًا يأتي الإجماع الفعلي: يجب أن تتفق كل نموذج تقريبًا تمامًا. ليس 51%.
مييرا تطالب بتوافق شبه كامل عبر نماذج مدربة بشكل مستقل.
لذا بدلاً من الوثوق بنموذج عبقري واحد لديه جميع الإجابات، قامت ميرا ببناء بروتوكول حيث يقوم عدد من الوكلاء غير المثاليين بإجراء فحوصات اقتصادية ورياضية على بعضهم البعض حتى تبقى الحقيقة فقط.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
GM! تم تصميم نماذج LLMs اليوم لتكون واثقة. إنها تولد فقرات كاملة من الإجابات المنقحة دون أي طريقة مدمجة للتحقق من كل جزء.
إنه مثل الثقة في رجل مقنع حقًا لا يظهر أي إيصالات.
بدلاً من محاولة تحسين النموذج المثالي، يفترضون أن كل نموذج سيكون خاطئًا في بعض الأحيان. لذلك، يجعلونه قابلًا للتحقق من خلال التصميم.
أولاً، يقومون بتقسيم المخرجات إلى مطالب ذرية.
قل إن #AI يعطيك هذا البيان: "Bitcoin هي العملة الرقمية الأكثر انتشارًا، التي أنشأها ساتوشي ناكاموتو في عام 2008."
ميرا لا تأخذ ذلك كبيان واحد فقط. بل تقوم بتفكيكه إلى مزاعم منفصلة يمكن التحقق منها:
→ "بيتكوين هو أكثر العملات المشفرة احتفاظًا بها"
→ "تم إنشاء البيتكوين بواسطة ساتوشي ناكاموتو"
→ "تم إنشاء البيتكوين في عام 2008"
يمكن التحقق من كل واحد من هؤلاء بشكل مستقل من قبل الشبكة. قد يكون أحدها ذاتيًا مثل كيفية تعريفك لأكثر الآراء شيوعًا، وآخر هو حقيقة مثل من قام بإنشائه، وآخر يتعلق بالوقت مثل متى تم صنعه.
هذه هي قوة الثنائية، تحويل مخرجات الذكاء الاصطناعي الضبابية إلى ادعاءات واضحة وقابلة للتحقق لا تعتمد على اهتزازات النموذج.
ثم يرسلون تلك المطالبات عبر شبكة لامركزية من المدققين لكن لا يرى أي عقدة المدخل الكامل.
هذا هو التحقق الموزع. كل عقدة تتحقق من جزء، مما يحافظ على الخصوصية ويضمن عدم اختناق الثقة.
الآن، كيف تجعل هؤلاء المدققين صادقين؟ → اجعلهم يراهنون.
كل عقد لديه مصلحة في اللعبة. إذا قام بالتحقق من هلوسة، يتم خصم جزء منه. هذه هي دليل التحقق، مما يحول الاستدلال إلى عمل اقتصادي حقيقي، وليس مجرد مضاربة.
وأخيرًا يأتي الإجماع الفعلي: يجب أن تتفق كل نموذج تقريبًا تمامًا. ليس 51%.
مييرا تطالب بتوافق شبه كامل عبر نماذج مدربة بشكل مستقل.
لذا بدلاً من الوثوق بنموذج عبقري واحد لديه جميع الإجابات، قامت ميرا ببناء بروتوكول حيث يقوم عدد من الوكلاء غير المثاليين بإجراء فحوصات اقتصادية ورياضية على بعضهم البعض حتى تبقى الحقيقة فقط.
إنها آلة توافقية للواقع لتوسيع الثقة.