متصفح الذكاء الاصطناعي: ساحة معركة جديدة وفرص في الحرب الثالثة للمتصفحات

متصفح الذكاء الاصطناعي: ساحة الحرب الثالثة للمتصفحات

الحرب الثالثة على المتصفحات بدأت في الخفاء. من نتسكيب إلى إنترنت إكسبلورر، ثم إلى فايرفوكس وكروم، كانت المنافسة بين المتصفحات دائمًا تجسيدًا للسيطرة على المنصات وتغير معايير التكنولوجيا. حصل كروم على مكانة الهيمنة بفضل سرعة التحديث وترابط النظام البيئي، وشكلت جوجل من خلال هيكل "ثنائي الاحتكار" بين البحث والمتصفح حلقة مغلقة لدخول المعلومات.

ومع ذلك، فإن هذه الصورة بدأت تتزعزع. إن ظهور نماذج اللغة الكبيرة (LLM) يجعل المزيد من المستخدمين يكملون المهام في صفحة نتائج البحث "بلا نقر"، مما يقلل من سلوك النقر التقليدي على صفحات الويب. في الوقت نفسه، فإن الشائعات حول نية Apple استبدال محرك البحث الافتراضي في Safari تهدد المزيد من أساسيات أرباح Alphabet، مما يثير القلق في السوق بشأن "الشرعية في البحث".

تواجه المتصفحات إعادة تشكيل دورها. فهي ليست مجرد أداة لعرض صفحات الويب، بل هي مجموعة من القدرات المختلفة مثل إدخال البيانات، سلوك المستخدم، والخصوصية. على الرغم من قوة وكيل الذكاء الاصطناعي، إلا أنه لإنجاز تفاعلات الصفحة المعقدة، واستدعاء بيانات الهوية المحلية، والتحكم في عناصر الصفحة، لا يزال بحاجة إلى الاستفادة من حدود الثقة وبيئة العمل للمتصفح. إن المتصفح يتحول من واجهة بشرية إلى منصة استدعاء نظام للوكيل.

إن ما يمكن أن يكسر حقًا هيمنة سوق المتصفحات الحالي ليس "كروم" أفضل، بل هي بنية تفاعلية جديدة: ليست عرض المعلومات، بل استدعاء المهام. يجب أن يتم تصميم المتصفح في المستقبل لوكلاء الذكاء الاصطناعي - ليس فقط للقراءة، ولكن أيضًا للكتابة والتنفيذ. تحاول مشاريع مثل Browser Use جعل هيكل الصفحة دلاليًا، وتحويل الواجهة المرئية إلى نصوص هيكلية يمكن لوحدات LLM استدعاؤها، مما يحقق خريطة بين الصفحة والتعليمات، ويقلل بشكل كبير من تكلفة التفاعل.

بدأت المشاريع الرائجة تجربة جديدة: قامت Perplexity ببناء متصفح أصلي Comet، مستخدمة الذكاء الاصطناعي بدلاً من نتائج البحث التقليدية؛ أما Brave فقد دمجت حماية الخصوصية مع الاستدلال المحلي، معززةً البحث ووظائف الحجب باستخدام LLM؛ بينما تستهدف مشاريع مثل Donut وغيرها من المشاريع الأصلية في عالم العملات الرقمية، مدخلاً جديداً للتفاعل بين الذكاء الاصطناعي والأصول على السلسلة. تتمثل الخصائص المشتركة لهذه المشاريع في: محاولة إعادة بناء مدخل المتصفح، بدلاً من تجميل طبقة الخرج.

بالنسبة لرواد الأعمال، تكمن الفرص في العلاقة الثلاثية بين الإدخال، الهيكل، والوكلاء. المتصفح كواجهة مستقبلية لاستدعاء العالم بواسطة الوكلاء، يعني أن من يستطيع تقديم "كتل القدرة" القابلة للهيكلة، القابلة للاستدعاء، والموثوقة، يمكنه أن يصبح جزءًا من الجيل الجديد من المنصات. من SEO إلى AEO (تحسين محرك الوكلاء)، من حركة مرور الصفحات إلى استدعاء سلسلة المهام، يتم إعادة تشكيل شكل المنتجات وتفكير التصميم. الحرب الثالثة للمتصفحات تحدث في "الإدخال" وليس في "العرض"؛ لم يعد تحديد الفائز يعتمد على من يجذب انتباه المستخدم، بل على من يكسب ثقة الوكيل، ويحصل على مدخلات الاستدعاء.

تاريخ تطور المتصفح

في أوائل التسعينيات ، ظهرت Netscape Navigator بشكل مفاجئ ، مما فتح الأبواب لعالم الرقمنة لملايين المستخدمين. بعد ذلك ، قامت مايكروسوفت بتجميع Internet Explorer في نظام ويندوز ، مما أدى إلى تفكيك مكانة Netscape في السوق.

مهندسو نتسكيب يعلنون عن شفرة مصدر المتصفح، مما يضع الأساس لمشروع موزيلا. حقق فايرفوكس اختراقات في تجربة المستخدم، ونظام المكونات الإضافية، والأمان، مما يدل على انتصار روح المصدر المفتوح.

في عام 2008، أطلقت Google متصفح Chrome، الذي تم بناؤه على مشروع Chromium مفتوح المصدر ومحرك WebKit. سرعان ما ارتفع Chrome بفضل التحديثات المتكررة وتجربة موحدة عبر جميع المنصات، حيث تجاوز Firefox في عام 2011، وبعد ستة أشهر، تجاوز IE مرة أخرى، مما أكمل التحول من مت challenger إلى متسيد.

في العقد 2020، كانت حصة سوق متصفح كروم العالمية مستقرة عند حوالي 65%. يشكل محرك بحث جوجل ومتصفح كروم نظام هيمنة مزدوج، حيث يتحكمان في مدخلات البحث و"النافذة الأولى" لدخول المستخدمين إلى الإنترنت.

مع ظهور نماذج اللغة الكبيرة (LLM)، تأثرت محركات البحث التقليدية. في عام 2024، تراجعت حصة سوق بحث Google من 93% إلى 89%. الشائعات حول احتمال إطلاق Apple لمحرك بحث AI خاص بها زعزعت دعائم أرباح Alphabet، مما أثار قلق السوق بشأن مستقبل عصر البحث.

من نافيجيتور إلى كروم، من المثل العليا مفتوحة المصدر إلى الترويج التجاري، من المتصفح الخفيف إلى مساعد البحث الذكي، كانت حرب المتصفحات دائمًا تدور حول التكنولوجيا والمنصات والمحتوى والسلطة. من يمتلك المدخل، هو من يحدد المستقبل.

الهيكل القديم للمتصفحات الحديثة

تشمل بنية المتصفح التقليدي:

  1. واجهة دخول العميل الأمامية: إكمال فك تشفير TLS، أخذ عينات QoS والتوجيه الجغرافي.

  2. فهم الاستعلام: إجراء تصحيح الإملاء، توسيع المرادفات وتحليل النية.

  3. استرجاع المرشحين: استخدام الفهرس العكسي وفهرس المتجهات لإجراء筛选 أولية.

  4. الترتيب المتعدد المستويات: تصفية صفحات المرشحين إلى حوالي 1000 مقالة من خلال الميزات الخفيفة.

  5. التعلم العميق للترتيب الرئيسي: استخدام تقنيات مثل RankBrain و Neural Matching لفهم معنى الاستعلام.

  6. إعادة ترتيب عميقة: تطبيق نموذج BERT لترتيب الوثائق بدقة.

هذا الهيكل أصبح قديمًا في عصر الذكاء الاصطناعي والبيانات الضخمة، واحتياجات المستخدمين للتفاعل مع المتصفح تتغير.

أسباب إعادة تشكيل المتصفح بواسطة الذكاء الاصطناعي

ستظل المتصفحات موجودة لأنها منصة شاملة، لا تُستخدم فقط لقراءة البيانات، بل أيضًا كمدخل عام لإدخال البيانات. يحتاج العالم إلى إنتاج البيانات والتفاعل مع المواقع، وستظل المتصفحات التي تُدمج معلومات المستخدمين المخصصة موجودة على نطاق واسع.

المتصفح هو مكان تخزين المحتوى المخصص:

  • معظم النماذج الكبيرة مستضافة على السحابة، مما يجعل من الصعب استدعاء البيانات الحساسة المحلية مباشرة.
  • يجب الحصول على إذن جديد من المستخدم لإرسال جميع البيانات إلى نموذج طرف ثالث.
  • يجب إكمال ملء رمز التحقق تلقائيًا، واستخدام الكاميرا، وما إلى ذلك، داخل صندوق الرمل الخاص بالمتصفح.
  • يعتمد سياق البيانات بشكل كبير على المتصفح، بما في ذلك علامات التبويب وملفات تعريف الارتباط والذاكرة المؤقتة وغيرها.

التحولات العميقة في أشكال التفاعل

يمكن تقسيم سلوك استخدام المتصفح إلى قراءة البيانات وإدخال البيانات وتفاعل البيانات. لقد غيرت LLM كفاءة وطرق قراءة البيانات، حيث أصبح البحث القائم على الكلمات الرئيسية يبدو قديمًا وغير فعال.

تظهر الدراسات أن حوالي 63% من استفسارات Google تنتمي إلى سلوك "عدم النقر". يعتاد المستخدمون على الحصول على المعلومات مباشرة من صفحة نتائج البحث. ومع ذلك، يعتقد 44% من المشاركين في الاستطلاع أن النتائج الطبيعية التقليدية أكثر موثوقية من الملخصات المختارة.

يحتاج متصفح الذكاء الاصطناعي إلى استكشاف أشكال التفاعل المناسبة، خاصة في ما يتعلق بقراءة البيانات، لأن مشكلة "الوهم" للنماذج الكبيرة الحالية لم تُحل بعد.

الطبقة التفاعلية للبيانات هي التي أثارت ثورة المتصفح. يميل المستخدمون بشكل متزايد إلى استخدام اللغة الطبيعية لوصف المهام المعقدة، وهذه المهام المسؤولة عن الوكيل يتم استلامها من قبل الوكلاء الذكاء الاصطناعي.

يجب أن يكون المتصفح في المستقبل مصممًا بالكامل للتشغيل التلقائي، مع الأخذ في الاعتبار:

  • كيف يمكن التوازن بين تجربة قراءة الإنسان وقابلية تحليل وكيل الذكاء الاصطناعي
  • كيفية خدمة المستخدمين ونماذج الوكلاء على نفس الصفحة

استخدام المتصفح

استخدم المتصفح طبقة دلالية حقيقية لبناء بنية التعرف الدلالي للجيل التالي من المتصفحات. إنه يعيد فك ترميز DOM التقليدي إلى "DOM دلالي"، مما يسمح للوكيل بالتفاعل بدقة دون الحاجة إلى "نقاط عرض الفيديو".

السمات الرئيسية:

  • تجريد العناصر التفاعلية إلى مقاطع JSON مع البيانات الوصفية
  • تحويل الصفحة بأكملها إلى "قائمة عقد دلالية مسطحة"
  • استقبل التعليمات العليا الناتجة عن LLM وأعد تشغيلها في المتصفح الحقيقي

بمجرد أن يتم إدخال هذه المعايير في W3C ، ستساعد بشكل كبير في حل مشكلات إدخال المتصفح.

ARC

أفادت شركة Browser أن متصفح ARC سيدخل في صيانة عادية، وسيتحول تركيز الفريق نحو متصفح DIA الموجه نحو الذكاء الاصطناعي. يتوقعون أن صفحات الويب لم تعد هي واجهة التفاعل الرئيسية، لكن هذا الحكم يقلل من دور المتصفح.

النماذج الكبيرة ممتازة في التقاط النوايا، ولكن قدرتها على تحمل كثافة المعلومات غير كافية. لا تزال الصفحات المخصصة تتمتع بميزة في السيناريوهات التفاعلية المعقدة. لم يتمكن فريق ARC من التمييز بين أبعاد الإدخال والإخراج التفاعلية، وتجاهلوا الدور الأساسي للمتصفح في تقديم المعلومات وتجربة التخصيص.

لإحداث تغيير حقيقي في Chrome، يجب إعادة تصميم وضع عرض المتصفح بشكل جذري ليتناسب مع متطلبات التفاعل التي يقودها وكيل الذكاء الاصطناعي، خاصة فيما يتعلق بتصميم هيكل إدخال الجانب.

حيرة

Perplexity هو محرك بحث AI، وبلغت قيمته الحالية 14 مليار دولار. يتعامل مع أكثر من 400 مليون عملية بحث شهريًا، ولديه أكثر من 30 مليون مستخدم نشط شهريًا.

إنه يقوم ببناء متصفح أصلي يسمى Comet، ويخطط لدمج محرك إجابات Perplexity بشكل عميق. لكن لا يزال يتعين حل مشكلة ارتفاع تكاليف البحث وانخفاض هوامش الربح.

تقوم جوجل أيضًا بإعادة تشكيل الذكاء الاصطناعي، حيث أطلقت تجربة جديدة لصفحات علامات التبويب في المتصفح "Project Mariner". من الصعب تهديد جوجل فقط من خلال تقليد الوظائف، فاختراق حقيقي يتطلب إعادة بناء هيكل المتصفح من الأساس.

شجاع

Brave هو متصفح Crypto ناجح إلى حد ما، يعتمد على بنية Chromium. عدد المستخدمين النشطين شهريًا يصل إلى 82.7 مليون، وحصة السوق حوالي 1%-1.5%.

من المقرر أن تقوم Brave بترقية متصفحها ليكون موجهًا نحو الخصوصية، ولكنها مقيدة بالحصول على بيانات المستخدم، مما يؤدي إلى انخفاض مستوى تخصيص النموذج الكبير. مساعدها الذكي ليون يبدو أكثر كإضافة خارجية، ولا توجد استراتيجية واضحة للتحول الكامل إلى وكيل ذكاء اصطناعي.

دونات

دونات هو مشروع ناشئ لمتصفح Agentic في صناعة التشفير، وقد حصل على تمويل قدره 7 ملايين دولار. الهدف هو تحقيق القدرة المتكاملة لـ"استكشاف - اتخاذ القرار - التنفيذ الأصلي للتشفير".

الجوهر هو دمج مسارات التنفيذ الآلي الأصلية للتشفير. في المستقبل، قد تحل الوكيل محل محركات البحث كمدخل رئيسي للتدفق، وسيتنافس رواد الأعمال على الزيارات وتحويلات التدفق الناتجة عن تنفيذ الوكيل.

نصائح لرواد الأعمال

لا يزال المتصفح هو "البوابة الرئيسية" الأكثر عدم إعادة هيكلتها في عالم الإنترنت. النقطة الحاسمة الحقيقية تكمن في "جانب الإدخال" - كيفية جعل وكيل الذكاء الاصطناعي يستدعي المنتجات بنشاط لإنجاز المهام.

يجب على رواد الأعمال النظر في تصميم المنتج من ثلاثة أبعاد:

  1. معيارية هيكل الواجهة: هل المنتج "قابل للاستدعاء"؟ هل يدعم هيكل DOM الدلالي أو خريطة JSON؟

  2. الهوية والمرور: هل يمكن أن يساعد الوكيل في "تجاوز حواجز الثقة"؟ خاصة في سيناريوهات Web3، هناك حاجة إلى هوية موحدة وقدرة على التوقيع.

  3. فهم آلية الحركة مرة أخرى: من SEO إلى AEO/ATF، يجب أن يكون لدى المنتج وضوح في حجم المهام، ليتناسب مع قواعد استدعاء إطار LLM المختلفة.

يجب أن تجعل المشاريع الريادية المستقبلية المتصفحات الحالية تعمل كخدمة للوكيل، لبناء جسر للجيل الجديد من "تدفقات التعليمات". يجب بناء "نحو الواجهة" لنداءات الوكيل، لتكون جزءًا من سلسلة الثقة للوكيل، وإنشاء "قلعة واجهات برمجة التطبيقات" لنمط البحث القادم.

عصر Web3 + AI Agent ، يكمن المفتاح في استدعاء السلسلة لالتقاط نية تنفيذ الوكيل ، وليس فقط الاعتماد على واجهة المستخدم لجذب انتباه المستخدم.

AGENT18.98%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 6
  • مشاركة
تعليق
0/400
RugpullSurvivorvip
· 07-06 21:50
يبدو أن Edge سيحقق انتصارا.
شاهد النسخة الأصليةرد0
FUDwatchervip
· 07-04 14:17
时代变了صديق
شاهد النسخة الأصليةرد0
TokenUnlockervip
· 07-04 14:17
يجب أن تكون جميعها في متصفح AI
شاهد النسخة الأصليةرد0
StealthDeployervip
· 07-04 14:17
المعركة للتو بدأت
شاهد النسخة الأصليةرد0
FomoAnxietyvip
· 07-04 14:04
السوق دائماً في دورة
شاهد النسخة الأصليةرد0
GasBanditvip
· 07-04 14:04
ستتغير الهيمنة
شاهد النسخة الأصليةرد0
  • تثبيت