بعد انفجار ChatGPT ، أصبح نموذج الذكاء الاصطناعي نقطة ساخنة تتبعها العديد من شركات التكنولوجيا. من محادثات الدردشة ، إلى إنشاء الصور ، إلى مكتب سطح المكتب ، يبدو أن الذكاء الاصطناعي لديه قوة خارقة لتخريب كل شيء بين عشية وضحاها.
انتشر الجنون في صناعة السيارات ، وبدأ الممارسون يفكرون: هل من الممكن ترك GPT تصنع السيارات؟
أعلنت بعض شركات السيارات أنها ستطبق تقنية نماذج واسعة النطاق ، بينما قالت شركات أخرى إنها ستصل إلى طرز كبيرة تابعة لجهات خارجية ، وسارعت بعض شركات السيارات لإصدار نظام القيادة الأوتوماتيكي بكلمة GPT.
أخبر بعض الممارسين Shentu أن قمرة القيادة الذكية والقيادة التلقائية قد تكون أول سيناريوهات تطبيق للنماذج الكبيرة. من بينها ، القيادة الذاتية هي الأكثر توقعًا.
القيادة الذاتية مسار صعب للغاية. بالإضافة إلى عمالقة التكنولوجيا مثل Google و Baidu ، كرس عدد كبير من رواد الأعمال الموهوبين أنفسهم لها وحرقوا مليارات الدولارات ، لكنهم حتى الآن لم يحققوا نتائج مرضية.
نموذج كبير للذكاء الاصطناعي يدخل في القيادة التلقائية ، هل سيكون الأمر مختلفًا هذه المرة؟
ما مقدار العلاقة بين GPT والسيارات؟
ليس لـ GPT علاقة مباشرة بالسيارات الظاهرة على السطح ، لكنها في الحقيقة لها علاقة عميقة. يجب أن تبدأ القصة منذ ست سنوات.
في يونيو 2017 ، قام ماسك ، رئيس شركة Tesla ، بصيد باحث سلوفاكى من شركة OpenAI. كان الرجل هو أندريه كارباثي ، الذي أصبح فيما بعد مديرًا لمنظمة تسلا للذكاء الاصطناعي.
في ذلك الوقت ، أظهر ماسك اهتمامًا كبيرًا بالذكاء الاصطناعي ، وكان أيضًا أحد مؤسسي OpenAI. بعد فترة وجيزة من تجنيد Andrej Karpathy ، غادر Musk مجلس إدارة OpenAI ، وكان يعتقد أن كلاً من Tesla و OpenAI كانا يبحثان عن الذكاء الاصطناعي ، وقد يكون هناك تضارب في المصالح في المستقبل.
في وقت لاحق ، أعاد Andrej Karpathy كتابة خوارزمية الطيار الآلي في Tesla وطور تقنية BEV للإدراك البصري الخالص ، والتي جلبت الطيار الآلي Tesla إلى مرحلة جديدة. وراهن مالكه السابق ، OpenAI ، على جميع الرقائق على الذكاء الاصطناعي العام ، وأخيراً طور GPT.
من منظور المنتج ، فإن GPT الخاص بـ OpenAI و Tesla's BEV نوعان مختلفان تمامًا. ولكن من منظور التكنولوجيا الأساسية ، فإنهم جميعًا يعتمدون على تقنية الذكاء الاصطناعي ، وخاصة تطبيق نموذج Google Transformer.
Transformer عبارة عن بنية شبكة عصبية للتعلم العميق اقترحها 8 من علماء الذكاء الاصطناعي في Google في عام 2017. هذا اختراع مهم للغاية في صناعة الذكاء الاصطناعي. يشير الحرف "T" في ChatGPT المشهور اليوم إلى نموذج Transformer.
يختلف عن الشبكة العصبية التقليدية RNN و CNN ، يستخدم Transformer آلية الاهتمام الذاتي لتعدين الاتصال والارتباط بين العناصر المختلفة في التسلسل ، ولديه قدرة جيدة على معالجة بيانات السلاسل الزمنية. وهذا يسمح لها بإظهار الأداء المتميز في مهام مثل الترجمة الآلية وتلخيص النص وأنظمة الإجابة على الأسئلة.
لذلك ، تم استخدام Transformer لأول مرة في مجال NLP (المعالجة المتقدمة للغة الطبيعية) لفهم النص البشري واللغة.
التدريب المسبق على نموذج Transformer ، بعد الضبط الدقيق المستمر والتكرار ، أطلقت OpenAI على التوالي نماذج تدريب لغة كبيرة مثل GPT-1 و GPT-2 و GPT-3 و GPT-4. ChatGPT هو روبوت حوار تم تطويره بواسطة OpenAI بعد ضبط نموذج GPT-3. نظرًا لأنه يمكن أن يتفاعل بطريقة محادثة ، فإن الأشخاص العاديين سهل الاستخدام ، وهو أكثر "ذكاءً" من روبوتات المحادثة في الماضي ، لذا فهو يتألق.
بشكل أساسي ، يشترك نموذج GPT الخاص بـ ChatGPT ونموذج LaMDA من Google ونموذج Wenxin من Baidu في نفس الأصل.
أدى استخدام نموذج Transformer للغة الطبيعية إلى ظهور تطبيقات الدردشة مثل ChatGPT ، كما حقق استخدامه في رؤية الكمبيوتر نتائج مذهلة ، والرائد في هذا الصدد هو Tesla.
كان Andrej Karpathy مسؤولاً عن قيادة فريق رؤية الكمبيوتر للقيادة الذاتية خلال فترة عمله كمدير AI في Tesla. من خلال الجمع بين نموذج Transformer ، نجح Tesla في تطوير تقنية BEV.
الاسم الكامل لـ BEV هو Bird's Eye View ، وهو منظر عين الطائر. يمكنه تحويل الصور ثنائية الأبعاد التي تم التقاطها بواسطة الكاميرا إلى صور ثلاثية الأبعاد عن طريق الربط ، وتحويلها بشكل موحد إلى زاوية الإغفال للمعالجة ، وتشكيل "منظور الله". والسبب في ذلك هو أن القيادة تتم في فضاء ثلاثي الأبعاد ، وما يراه الناس هو عالم ثلاثي الأبعاد ، وليس صورة ثنائية الأبعاد.
سيتم عرض حل الإدراك الجديد هذا بواسطة Andrej Karpathy في Tesla AI DAY في أغسطس 2021. لهذا السبب ، لم يتردد تسلا في إعادة كتابة خوارزمية الطيار الآلي وأعاد بناء البنية التحتية لتدريب الشبكات العصبية العميقة.
هذه هي المرة الأولى التي يتم فيها تطبيق تقنية طراز كبير على صناعة القيادة الذاتية.
إذا نظرنا إلى الوراء اليوم ، على الرغم من استخدام GPT حاليًا بشكل أساسي في مجال معالجة اللغة الطبيعية ، لا يمكننا السماح لـ GPT بقيادة السيارة ، لكن تقنية النموذج الكبير لمنظمة العفو الدولية التي تقف وراءها ، وخاصة بنية المحولات ، كانت تعمل بشكل مستقل في الواقع. تطبيق المجال.
من معالجة اللغة الطبيعية إلى رؤية الكمبيوتر ، قام المجالان بتوحيد بنية النمذجة بناءً على بنية المحولات ، مما يجعل النمذجة المشتركة أسهل.
ومع تعمق فهم الذكاء الاصطناعي ، أصبحت شركات السيارات أكثر فأكثر مثل شركات الذكاء الاصطناعي. بالإضافة إلى Tesla ، أعلنت Li Auto عن رؤية شركتها في وقت سابق من هذا العام ، مدعية أنها ستصبح شركة ذكاء اصطناعي بحلول عام 2030. ستطلق نظام القيادة بمساعدة الملاحة في المناطق الحضرية NOA هذا العام ، والدعم الفني هو تصور BEV ونموذج Transformer.
يبدو أنه لا يوجد فرق بين السماح للذكاء الاصطناعي بالتحدث مع الأشخاص والسماح للذكاء الاصطناعي بقيادة السيارة ، فيما عدا أن سيناريوهات الهبوط بينهما مختلفة. يمتلئ البشر دائمًا بالخيال عندما يتعلق الأمر بتطبيق التكنولوجيا الأساسية على منتجات معينة.
تعلم GPT هذه الأشياء عن القيادة التلقائية
منذ بداية هذا العام ، صدمت القدرات القوية التي أظهرتها GPT العالم الخارجي. لم يعد الذكاء الاصطناعي العام قلعة في الهواء. بدأ الأشخاص في صناعة القيادة الذاتية في التفكير في أنه ربما يمكن نقل تطبيق الذكاء الاصطناعي التوليفي على نماذج اللغة إلى القيادة الذاتية.
في الأساس ، نموذج اللغة هو نموذج رياضي للغة البشرية. لا يزال الكمبيوتر لا يفهم اللغة الطبيعية ، لكنه يحول مشاكل اللغة إلى مشاكل رياضية من خلال النمذجة الرياضية. تُفهم اللغة الطبيعية بشكل غير مباشر من خلال التنبؤ باحتمالية ظهور الكلمة التالية عبر تاريخ نص معين.
بالانتقال إلى مشهد القيادة ، بالنظر إلى بيئة المرور الحالية وخريطة التنقل وسجل سلوك القيادة للسائق ، هل يمكن للنموذج الكبير توقع إجراء القيادة التالي؟
قال يو كاي ، مؤسس Horizon ، في منتدى 100 للمركبات الكهربائية الذي عقد في أبريل من هذا العام ، إن ChatGPT ألهمته كثيرًا ، "سنواصل استخدام البيانات الضخمة ، والبيانات الأكبر ، والنماذج الأكبر ، والتعلم غير الخاضع للإشراف. يحاول البشر القيادة. ، تمامًا كما تتعلم من كمية كبيرة من النصوص الطبيعية غير الخاضعة للإشراف وغير المصنفة ". يجادل بأن تسلسل عناصر التحكم في القيادة لكل سائق يشبه نصوص لغتنا الطبيعية. بعد ذلك ، يريد بناء نموذج لغوي كبير يعود إلى القيادة الذاتية.
من الناحية النظرية ، هذه الفكرة ممكنة. الذكاء الاصطناعي لديه بالفعل القدرة على التعلم. وفقًا لنموذج اللغة التكيفية ، ستستمر الآلة في التحسين المتكرر وفقًا لتعليقات المستخدم ، وتعلم عادات المستخدم ، ثم تحسين النموذج. يستخدم ChatGPT الحالي هذه التقنية. بعد ذلك ، ليس من الصعب على الماكينة تعلم عادات القيادة لدى السائق.
وضع الظل في Tesla هو تغذية بيانات القيادة للسائقين الحقيقيين للتعلم الآلي. يتم تحقيق الغرض من تدريب الخوارزمية من خلال مقارنة سلوك السائقين البشريين.
بعد أن أطلقت GPT جولة جديدة من طفرة الذكاء الاصطناعي ، كان التأثير المعرفي على الصناعة هو أنه من خلال زيادة مقياس المعلمات للنموذج ، تزداد كمية البيانات أضعافًا مضاعفة ، وهو ما يسمى بالنموذج الكبير. بعد الوصول إلى نقطة حرجة معينة يمكن أن تصبح النماذج ذكية فجأة.
في الماضي ، كانت البيانات المطلوبة من قبل النموذج أثناء مرحلة التدريب تُوسم يدويًا. بأخذ القيادة الذاتية كمثال ، يستخدم واضع البيانات عددًا كبيرًا من الصور لتسمية وإخبار الماكينة ما هو القط ، وما هو الكلب ، وعدد أنواع القطط والكلاب الموجودة. المعلق هو مثل معلم الآلة ، يعلمها أن تفهم العالم مرارًا وتكرارًا.
المشكلة هي ، ما لم يعلمه المعلم ، وما زالت الآلة لا تستطيع. والمثال النموذجي هو أن تسلا تعرضت لحوادث طيار آلي عدة مرات ، واصطدمت السيارة بشاحنة كبيرة انقلبت لأن الآلة لم تتمكن من التعرف عليها.
قدم هي يوهوا ، الشريك المؤسس لشركة Hegao Capital ، مثالًا لشينتو: تتمتع مدينة قوانغتشو بأيام صيفية ممطرة متكررة ، وفي بعض المشاهد ذات الأضواء الخافتة ، سيكون هناك عدد كبير من الحشرات الطائرة في الهواء. عندما تمر السيارة بالقرب من السيارة ، تضيء الأضواء ، وقد يكون هناك الآلاف من الحشرات الطائرة التي تصطدم بمقدمة السيارة. في هذه الحالة ، قد يخطئ نظام إدراك القيادة المستقل في السيارة على أنها جدار.
لا يمكن لنظام القيادة الأوتوماتيكي أن يستنفد جميع حالات المنعطفات (السيناريوهات القصوى) ، وهو ما يمثل صعوبة كبيرة في تطويره.
ما يستحوذ عليه ChatGPT هو البيانات غير المميزة للشبكة بأكملها. في التعلم تحت الإشراف الذاتي ، تُستخدم البيانات نفسها كإشارة إشرافية ، بدلاً من الاعتماد على الملصقات البشرية. اكتشف الناس يومًا ما أنه أثناء عملية هضم هذه البيانات ، أصبح للنموذج الكبير فجأة القدرة على استنتاج حالات أخرى من حالة واحدة.
لذا ، إذا كان النموذج الكبير للقيادة الذاتية يمكن أن يتعلم أيضًا سلوك القيادة البشرية دون إشراف ، دون الحاجة إلى "مدرس" لتعليمه ، فهل هذا يعني أن النظام قد تحول فجأة إلى "سائق قديم"؟
GPT "القيادة" ، ليست موثوقة
الأحلام جميلة ، والطريق إلى تحقيقها دائمًا ضيق جدًا.
لنموذج ذكاء اصطناعي مشابه لـ ChatGPT لممارسة قوته في مجال القيادة الذاتية ، يجب حل المشكلات التالية على الأقل في الوقت الحالي.
الأول هو مصدر البيانات.
تعد مصادر بيانات ChatGPT غنية جدًا ، بما في ذلك ويكيبيديا والكتب والمقالات الإخبارية والمجلات العلمية وما إلى ذلك ، وهو ما يعادل البيانات العامة للشبكة بأكملها كغذاء لها.
القيادة المستقلة مختلفة. لا يتم الإفصاح عن بيانات القيادة الخاصة بالسائق وبيانات قيادة السيارة ، ويشتمل الكثير منها على الخصوصية. تعمل شركات تصنيع السيارات والشركات ذاتية القيادة بشكل مستقل ، ويتم إغلاق البيانات وعدم تداولها ، مما يجعل من الصعب الحصول على البيانات. بدون بيانات ، القيادة الذاتية هي الماء بدون مصدر.
أخبر He Zhiqiang ، رئيس Lenovo Venture Capital ، Shentu أن جوهر القيادة الذاتية هو الحصول على البيانات ، والبيانات مهمة جدًا لنماذج التدريب. تمتلك الشركات المصنعة للمعدات الأصلية مثل BYD بيانات ، لكن الخوارزميات الخاصة بها لا تزال بحاجة إلى التحسين.الشركات المصنعة للسيارات الجديدة مثل "Wei Xiaoli" جيدة في الخوارزميات ، لكن مبيعات سياراتهم ليست كافية. يمكن للشركات التي لديها بيانات وخوارزميات الاستفادة الكاملة من النماذج الكبيرة.
والثاني هو أن طريقة نشر الحوسبة في النظام محدودة.
يعتقد Yu Kai أن OpenAI و ChatGPT يعملان على الحوسبة في السحابة ، التي تحتوي على إمدادات طاقة كافية ومصدر طاقة ونظام جيد جدًا. ومع ذلك ، إذا كانت السيارة تعتمد على البطارية وتبديد حرارة السيارة ، فهذا التحدي هو عظيم ، مما يعني أن القيادة التلقائية لا يمكن أن تستخدم مثل هذا النموذج الكبير ومثل هذا الحساب الكبير.
أدى استهلاك الطاقة الحاسوبية من قبل النماذج الكبيرة إلى أن تصبح الشركات المصنعة للحوسبة السحابية الدفعة الأولى من اللاعبين الذين يتمتعون بأرباح في هذه الموجة من طفرة الذكاء الاصطناعي. كما أن تطوير الشركات الكبرى للحوسبة السحابية يفتح الطريق أمام النماذج الكبيرة. لكن في نهاية السيارة ، سيكون هذا تناقضًا.
المشكلة الأكبر هي أنه لم يتم التحقق من موثوقية النماذج الكبيرة.
يعرف الأشخاص الذين استخدموا ChatGPT أن ChatGPT يتحدث أحيانًا عن هراء ، وأحيانًا يكون على صواب وأحيانًا خاطئ. يُعرف هذا في الصناعة بالميل نحو الهلوسة ، والميل إلى إنتاج محتوى غير واقعي ليس له أصل على الإطلاق. النماذج الكبيرة تصنع الأشياء دون الاهتمام بصدقها ودقتها.
قد تكون الدردشة هراء ، لكن القيادة التلقائية لا تفعل ذلك. قد تكون نتيجة أي إخراج خاطئ مميتة.
قال يو كاي: "لقد أحرزت ChatGPT تقدمًا كبيرًا ، لكن القيادة التلقائية لم تأت بعد ، لأن القيادة التلقائية ، وخاصة القيادة بدون طيار ، قد يكون لها معدل تسامح صفري مع الخطأ ، وهي مسألة حياة أو موت".
يعتقد Long Zhiyong ، الذي شغل سابقًا منصب مدير العمليات في شركة AI ناشئة في Silicon Valley ، أن التهديدات التي لا يمكن السيطرة عليها ولا يمكن التنبؤ بها ولا يمكن الاعتماد عليها هي أكبر التهديدات لتسويق النماذج الكبيرة. أحد المظاهر النموذجية هو أن النموذج الكبير يميل إلى الهلوسة.
الآن ، ليس من الواقعي أن يتعلم نظام القيادة الأوتوماتيكي الاختيار والتمييز ، وإخراج الحل الأمثل بثبات.
قال أحد المطلعين على شركة ذكاء اصطناعي لشركة Shentu: "هناك بالفعل العديد من الاختراقات في الإدراك البصري على مستوى الخوارزمية. لكن مشهد السيارة متطلب للغاية. أنا شخصياً لا أعتقد أنه سيكون هناك اختراق كبير على المدى القصير . يمكنك الانتباه إلى حركات Sla الخاصة ".
ومع ذلك ، كان هناك مؤخرًا اتجاه في دائرة التكنولوجيا يتمثل في رغبة الشركات ، كبيرة وصغيرة ، في إلقاء نظرة على النقاط الساخنة في GPT. أعلن بعض مصنعي السيارات أنهم على وشك تطبيق تقنية تشبه GPT ، ومجموعة من المفاهيم الرائعة تجعل الناس في حيرة من أمرهم.
على سبيل المثال ، أصدرت شركة قيادة ذاتية تابعة لشركة سيارات تقليدية نموذجًا توليديًا كبيرًا للقيادة الذاتية ، والذي يُطلق عليه "الأول في الصناعة" الذي يستخدم هذا النموذج لتدريب القيادة الذاتية.
سأل مستثمر كان يهتم بمسار السيارات الذكية لفترة طويلة أحد رواد الصناعة عن رأيه في النموذج ، وأجاب الطرف الآخر بأربع كلمات: "هراء TM".
علق المستثمر على Shentu: "إنه مجرد عمل علاقات عامة".
القيادة الذاتية ، هل سيتم قلبها وإعادة تشغيلها؟
بقيادة تسلا ، إلى جانب موجة الذكاء الاصطناعي الناشئة هذا العام ، تقترب صناعة القيادة المستقلة تدريجياً من اتجاه النماذج الكبيرة ، وقوة الحوسبة الكبيرة ، والبيانات الضخمة.
لم يكن تأثير النماذج الكبيرة على القيادة الذاتية قاسياً بما فيه الكفاية ، لكن الأشخاص الذين لديهم حاسة شم قوية أظهروا تناقضاً.
تمامًا مثلما استخدم Tesla Transformer لتحويل بيانات الكاميرا المتعددة من مساحة الصورة إلى مساحة BEV ، لم يتردد في الإطاحة بالبنية الأصلية وإعادة كتابة الخوارزمية. قد يعني تطبيق النماذج الكبيرة الآن أيضًا أنه سيتم الإطاحة بخوارزمية القيادة التلقائية الأصلية وإعادة تشغيلها.
يعتقد He Zhiqiang أن النماذج الكبيرة سيكون لها تأثير كبير على القيادة الذاتية. في الماضي ، تم استخدام العديد من النماذج الصغيرة للقيادة الذاتية ، لكنها أصبحت الآن نموذجًا كبيرًا ، وقد يكون من الضروري القيام بذلك مرة أخرى. سيتم إعادة تنظيم صناعة القيادة الذاتية.
أخبر Zhao Dongxiang ، مدير القيادة الذاتية في شركة شرائح الذكاء الاصطناعي ، Shentu أن التغيير الشامل من طرف إلى طرف يعادل القيام بذلك مرة أخرى.
الخلط فرصة للوافدين الجدد وتهديد للقادة. غالبًا ما تحدث قصة التجاوز على منحنى في فترة التغير التكنولوجي السريع. في عصر التكنولوجيا السريعة ، كلما زاد الاستثمار في المسار القديم ، زادت التكلفة الغارقة ، وزادت صعوبة التحول. بالنسبة لمصنعي المعدات الأصلية أو شركات القيادة المستقلة ، لتبني تقنية جديدة ، لا يجب مراعاة التأثير فحسب ، بل التكلفة أيضًا.
قال Zhao Dongxiang أنه فيما يتعلق بالمرحلة الحالية ، لا معنى لتغيير المسار التقني للقيادة الأوتوماتيكية. "الآن القدرات التقنية للصناعة ليست سيئة. لقد أنفق الجميع الكثير من المال وفعلوا ذلك لفترة طويلة. إذا كان هناك لا يمثل تحسنا جوهريا ، ولا يوجد دافع للتغيير ".
في AI DAY في نهاية العام الماضي ، قامت Tesla بترقية BEV إلى شبكة إشغال (شبكة إشغال) ، وتم تحسين قدرة التعميم بشكل أكبر. من خلال احتلال الشبكة ، يمكن لنظام إدراك الطيار الآلي في Tesla أن يقرر ما إذا كان يحتاج إلى تجنبه دون معرفة الشيء الذي يراه ، وبالتالي حل المزيد من المشكلات طويلة الذيل.
بغض النظر عن نوع المسار التقني ، فإنه يخضع الآن لتغييرات وتكرارات سريعة. يمكن استبدال النماذج الصغيرة في الماضي بنماذج كبيرة ، ويمكن أيضًا استبدال النماذج الكبيرة الحالية ببعض الأنواع الجديدة في المستقبل.
ولكن على أي حال ، فإن ممارسة فرك النقاط الساخنة وصنع الحيل لا تساعد على التقدم التكنولوجي. قال تشاو دونغشيانغ: "إنها عادة سيئة أن تتبع الحرارة ، ومن المفيد صنع منتجات بطريقة واقعية".
إن "القنبلة الملكية" الحقيقية للقيادة الذاتية بعيدة كل البعد عن أن تأتي. ما يتعين علينا القيام به هو أن نبقى في حالة من الرهبة من كل جولة من التغيير التكنولوجي. لا تستطيع GPT الأسطورية بناء سيارة أحلامك ، ولكن على الأقل ، حدثت تغييرات.
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
لا تستطيع GPT الأسطورية بناء سيارة أحلامك
بعد انفجار ChatGPT ، أصبح نموذج الذكاء الاصطناعي نقطة ساخنة تتبعها العديد من شركات التكنولوجيا. من محادثات الدردشة ، إلى إنشاء الصور ، إلى مكتب سطح المكتب ، يبدو أن الذكاء الاصطناعي لديه قوة خارقة لتخريب كل شيء بين عشية وضحاها.
انتشر الجنون في صناعة السيارات ، وبدأ الممارسون يفكرون: هل من الممكن ترك GPT تصنع السيارات؟
أعلنت بعض شركات السيارات أنها ستطبق تقنية نماذج واسعة النطاق ، بينما قالت شركات أخرى إنها ستصل إلى طرز كبيرة تابعة لجهات خارجية ، وسارعت بعض شركات السيارات لإصدار نظام القيادة الأوتوماتيكي بكلمة GPT.
أخبر بعض الممارسين Shentu أن قمرة القيادة الذكية والقيادة التلقائية قد تكون أول سيناريوهات تطبيق للنماذج الكبيرة. من بينها ، القيادة الذاتية هي الأكثر توقعًا.
القيادة الذاتية مسار صعب للغاية. بالإضافة إلى عمالقة التكنولوجيا مثل Google و Baidu ، كرس عدد كبير من رواد الأعمال الموهوبين أنفسهم لها وحرقوا مليارات الدولارات ، لكنهم حتى الآن لم يحققوا نتائج مرضية.
نموذج كبير للذكاء الاصطناعي يدخل في القيادة التلقائية ، هل سيكون الأمر مختلفًا هذه المرة؟
ما مقدار العلاقة بين GPT والسيارات؟
ليس لـ GPT علاقة مباشرة بالسيارات الظاهرة على السطح ، لكنها في الحقيقة لها علاقة عميقة. يجب أن تبدأ القصة منذ ست سنوات.
في يونيو 2017 ، قام ماسك ، رئيس شركة Tesla ، بصيد باحث سلوفاكى من شركة OpenAI. كان الرجل هو أندريه كارباثي ، الذي أصبح فيما بعد مديرًا لمنظمة تسلا للذكاء الاصطناعي.
في ذلك الوقت ، أظهر ماسك اهتمامًا كبيرًا بالذكاء الاصطناعي ، وكان أيضًا أحد مؤسسي OpenAI. بعد فترة وجيزة من تجنيد Andrej Karpathy ، غادر Musk مجلس إدارة OpenAI ، وكان يعتقد أن كلاً من Tesla و OpenAI كانا يبحثان عن الذكاء الاصطناعي ، وقد يكون هناك تضارب في المصالح في المستقبل.
في وقت لاحق ، أعاد Andrej Karpathy كتابة خوارزمية الطيار الآلي في Tesla وطور تقنية BEV للإدراك البصري الخالص ، والتي جلبت الطيار الآلي Tesla إلى مرحلة جديدة. وراهن مالكه السابق ، OpenAI ، على جميع الرقائق على الذكاء الاصطناعي العام ، وأخيراً طور GPT.
من منظور المنتج ، فإن GPT الخاص بـ OpenAI و Tesla's BEV نوعان مختلفان تمامًا. ولكن من منظور التكنولوجيا الأساسية ، فإنهم جميعًا يعتمدون على تقنية الذكاء الاصطناعي ، وخاصة تطبيق نموذج Google Transformer.
Transformer عبارة عن بنية شبكة عصبية للتعلم العميق اقترحها 8 من علماء الذكاء الاصطناعي في Google في عام 2017. هذا اختراع مهم للغاية في صناعة الذكاء الاصطناعي. يشير الحرف "T" في ChatGPT المشهور اليوم إلى نموذج Transformer.
يختلف عن الشبكة العصبية التقليدية RNN و CNN ، يستخدم Transformer آلية الاهتمام الذاتي لتعدين الاتصال والارتباط بين العناصر المختلفة في التسلسل ، ولديه قدرة جيدة على معالجة بيانات السلاسل الزمنية. وهذا يسمح لها بإظهار الأداء المتميز في مهام مثل الترجمة الآلية وتلخيص النص وأنظمة الإجابة على الأسئلة.
لذلك ، تم استخدام Transformer لأول مرة في مجال NLP (المعالجة المتقدمة للغة الطبيعية) لفهم النص البشري واللغة.
التدريب المسبق على نموذج Transformer ، بعد الضبط الدقيق المستمر والتكرار ، أطلقت OpenAI على التوالي نماذج تدريب لغة كبيرة مثل GPT-1 و GPT-2 و GPT-3 و GPT-4. ChatGPT هو روبوت حوار تم تطويره بواسطة OpenAI بعد ضبط نموذج GPT-3. نظرًا لأنه يمكن أن يتفاعل بطريقة محادثة ، فإن الأشخاص العاديين سهل الاستخدام ، وهو أكثر "ذكاءً" من روبوتات المحادثة في الماضي ، لذا فهو يتألق.
بشكل أساسي ، يشترك نموذج GPT الخاص بـ ChatGPT ونموذج LaMDA من Google ونموذج Wenxin من Baidu في نفس الأصل.
أدى استخدام نموذج Transformer للغة الطبيعية إلى ظهور تطبيقات الدردشة مثل ChatGPT ، كما حقق استخدامه في رؤية الكمبيوتر نتائج مذهلة ، والرائد في هذا الصدد هو Tesla.
كان Andrej Karpathy مسؤولاً عن قيادة فريق رؤية الكمبيوتر للقيادة الذاتية خلال فترة عمله كمدير AI في Tesla. من خلال الجمع بين نموذج Transformer ، نجح Tesla في تطوير تقنية BEV.
الاسم الكامل لـ BEV هو Bird's Eye View ، وهو منظر عين الطائر. يمكنه تحويل الصور ثنائية الأبعاد التي تم التقاطها بواسطة الكاميرا إلى صور ثلاثية الأبعاد عن طريق الربط ، وتحويلها بشكل موحد إلى زاوية الإغفال للمعالجة ، وتشكيل "منظور الله". والسبب في ذلك هو أن القيادة تتم في فضاء ثلاثي الأبعاد ، وما يراه الناس هو عالم ثلاثي الأبعاد ، وليس صورة ثنائية الأبعاد.
سيتم عرض حل الإدراك الجديد هذا بواسطة Andrej Karpathy في Tesla AI DAY في أغسطس 2021. لهذا السبب ، لم يتردد تسلا في إعادة كتابة خوارزمية الطيار الآلي وأعاد بناء البنية التحتية لتدريب الشبكات العصبية العميقة.
هذه هي المرة الأولى التي يتم فيها تطبيق تقنية طراز كبير على صناعة القيادة الذاتية.
إذا نظرنا إلى الوراء اليوم ، على الرغم من استخدام GPT حاليًا بشكل أساسي في مجال معالجة اللغة الطبيعية ، لا يمكننا السماح لـ GPT بقيادة السيارة ، لكن تقنية النموذج الكبير لمنظمة العفو الدولية التي تقف وراءها ، وخاصة بنية المحولات ، كانت تعمل بشكل مستقل في الواقع. تطبيق المجال.
من معالجة اللغة الطبيعية إلى رؤية الكمبيوتر ، قام المجالان بتوحيد بنية النمذجة بناءً على بنية المحولات ، مما يجعل النمذجة المشتركة أسهل.
ومع تعمق فهم الذكاء الاصطناعي ، أصبحت شركات السيارات أكثر فأكثر مثل شركات الذكاء الاصطناعي. بالإضافة إلى Tesla ، أعلنت Li Auto عن رؤية شركتها في وقت سابق من هذا العام ، مدعية أنها ستصبح شركة ذكاء اصطناعي بحلول عام 2030. ستطلق نظام القيادة بمساعدة الملاحة في المناطق الحضرية NOA هذا العام ، والدعم الفني هو تصور BEV ونموذج Transformer.
يبدو أنه لا يوجد فرق بين السماح للذكاء الاصطناعي بالتحدث مع الأشخاص والسماح للذكاء الاصطناعي بقيادة السيارة ، فيما عدا أن سيناريوهات الهبوط بينهما مختلفة. يمتلئ البشر دائمًا بالخيال عندما يتعلق الأمر بتطبيق التكنولوجيا الأساسية على منتجات معينة.
تعلم GPT هذه الأشياء عن القيادة التلقائية
منذ بداية هذا العام ، صدمت القدرات القوية التي أظهرتها GPT العالم الخارجي. لم يعد الذكاء الاصطناعي العام قلعة في الهواء. بدأ الأشخاص في صناعة القيادة الذاتية في التفكير في أنه ربما يمكن نقل تطبيق الذكاء الاصطناعي التوليفي على نماذج اللغة إلى القيادة الذاتية.
في الأساس ، نموذج اللغة هو نموذج رياضي للغة البشرية. لا يزال الكمبيوتر لا يفهم اللغة الطبيعية ، لكنه يحول مشاكل اللغة إلى مشاكل رياضية من خلال النمذجة الرياضية. تُفهم اللغة الطبيعية بشكل غير مباشر من خلال التنبؤ باحتمالية ظهور الكلمة التالية عبر تاريخ نص معين.
بالانتقال إلى مشهد القيادة ، بالنظر إلى بيئة المرور الحالية وخريطة التنقل وسجل سلوك القيادة للسائق ، هل يمكن للنموذج الكبير توقع إجراء القيادة التالي؟
قال يو كاي ، مؤسس Horizon ، في منتدى 100 للمركبات الكهربائية الذي عقد في أبريل من هذا العام ، إن ChatGPT ألهمته كثيرًا ، "سنواصل استخدام البيانات الضخمة ، والبيانات الأكبر ، والنماذج الأكبر ، والتعلم غير الخاضع للإشراف. يحاول البشر القيادة. ، تمامًا كما تتعلم من كمية كبيرة من النصوص الطبيعية غير الخاضعة للإشراف وغير المصنفة ". يجادل بأن تسلسل عناصر التحكم في القيادة لكل سائق يشبه نصوص لغتنا الطبيعية. بعد ذلك ، يريد بناء نموذج لغوي كبير يعود إلى القيادة الذاتية.
من الناحية النظرية ، هذه الفكرة ممكنة. الذكاء الاصطناعي لديه بالفعل القدرة على التعلم. وفقًا لنموذج اللغة التكيفية ، ستستمر الآلة في التحسين المتكرر وفقًا لتعليقات المستخدم ، وتعلم عادات المستخدم ، ثم تحسين النموذج. يستخدم ChatGPT الحالي هذه التقنية. بعد ذلك ، ليس من الصعب على الماكينة تعلم عادات القيادة لدى السائق.
وضع الظل في Tesla هو تغذية بيانات القيادة للسائقين الحقيقيين للتعلم الآلي. يتم تحقيق الغرض من تدريب الخوارزمية من خلال مقارنة سلوك السائقين البشريين.
بعد أن أطلقت GPT جولة جديدة من طفرة الذكاء الاصطناعي ، كان التأثير المعرفي على الصناعة هو أنه من خلال زيادة مقياس المعلمات للنموذج ، تزداد كمية البيانات أضعافًا مضاعفة ، وهو ما يسمى بالنموذج الكبير. بعد الوصول إلى نقطة حرجة معينة يمكن أن تصبح النماذج ذكية فجأة.
في الماضي ، كانت البيانات المطلوبة من قبل النموذج أثناء مرحلة التدريب تُوسم يدويًا. بأخذ القيادة الذاتية كمثال ، يستخدم واضع البيانات عددًا كبيرًا من الصور لتسمية وإخبار الماكينة ما هو القط ، وما هو الكلب ، وعدد أنواع القطط والكلاب الموجودة. المعلق هو مثل معلم الآلة ، يعلمها أن تفهم العالم مرارًا وتكرارًا.
المشكلة هي ، ما لم يعلمه المعلم ، وما زالت الآلة لا تستطيع. والمثال النموذجي هو أن تسلا تعرضت لحوادث طيار آلي عدة مرات ، واصطدمت السيارة بشاحنة كبيرة انقلبت لأن الآلة لم تتمكن من التعرف عليها.
قدم هي يوهوا ، الشريك المؤسس لشركة Hegao Capital ، مثالًا لشينتو: تتمتع مدينة قوانغتشو بأيام صيفية ممطرة متكررة ، وفي بعض المشاهد ذات الأضواء الخافتة ، سيكون هناك عدد كبير من الحشرات الطائرة في الهواء. عندما تمر السيارة بالقرب من السيارة ، تضيء الأضواء ، وقد يكون هناك الآلاف من الحشرات الطائرة التي تصطدم بمقدمة السيارة. في هذه الحالة ، قد يخطئ نظام إدراك القيادة المستقل في السيارة على أنها جدار.
لا يمكن لنظام القيادة الأوتوماتيكي أن يستنفد جميع حالات المنعطفات (السيناريوهات القصوى) ، وهو ما يمثل صعوبة كبيرة في تطويره.
ما يستحوذ عليه ChatGPT هو البيانات غير المميزة للشبكة بأكملها. في التعلم تحت الإشراف الذاتي ، تُستخدم البيانات نفسها كإشارة إشرافية ، بدلاً من الاعتماد على الملصقات البشرية. اكتشف الناس يومًا ما أنه أثناء عملية هضم هذه البيانات ، أصبح للنموذج الكبير فجأة القدرة على استنتاج حالات أخرى من حالة واحدة.
لذا ، إذا كان النموذج الكبير للقيادة الذاتية يمكن أن يتعلم أيضًا سلوك القيادة البشرية دون إشراف ، دون الحاجة إلى "مدرس" لتعليمه ، فهل هذا يعني أن النظام قد تحول فجأة إلى "سائق قديم"؟
GPT "القيادة" ، ليست موثوقة
الأحلام جميلة ، والطريق إلى تحقيقها دائمًا ضيق جدًا.
لنموذج ذكاء اصطناعي مشابه لـ ChatGPT لممارسة قوته في مجال القيادة الذاتية ، يجب حل المشكلات التالية على الأقل في الوقت الحالي.
الأول هو مصدر البيانات.
تعد مصادر بيانات ChatGPT غنية جدًا ، بما في ذلك ويكيبيديا والكتب والمقالات الإخبارية والمجلات العلمية وما إلى ذلك ، وهو ما يعادل البيانات العامة للشبكة بأكملها كغذاء لها.
القيادة المستقلة مختلفة. لا يتم الإفصاح عن بيانات القيادة الخاصة بالسائق وبيانات قيادة السيارة ، ويشتمل الكثير منها على الخصوصية. تعمل شركات تصنيع السيارات والشركات ذاتية القيادة بشكل مستقل ، ويتم إغلاق البيانات وعدم تداولها ، مما يجعل من الصعب الحصول على البيانات. بدون بيانات ، القيادة الذاتية هي الماء بدون مصدر.
أخبر He Zhiqiang ، رئيس Lenovo Venture Capital ، Shentu أن جوهر القيادة الذاتية هو الحصول على البيانات ، والبيانات مهمة جدًا لنماذج التدريب. تمتلك الشركات المصنعة للمعدات الأصلية مثل BYD بيانات ، لكن الخوارزميات الخاصة بها لا تزال بحاجة إلى التحسين.الشركات المصنعة للسيارات الجديدة مثل "Wei Xiaoli" جيدة في الخوارزميات ، لكن مبيعات سياراتهم ليست كافية. يمكن للشركات التي لديها بيانات وخوارزميات الاستفادة الكاملة من النماذج الكبيرة.
والثاني هو أن طريقة نشر الحوسبة في النظام محدودة.
يعتقد Yu Kai أن OpenAI و ChatGPT يعملان على الحوسبة في السحابة ، التي تحتوي على إمدادات طاقة كافية ومصدر طاقة ونظام جيد جدًا. ومع ذلك ، إذا كانت السيارة تعتمد على البطارية وتبديد حرارة السيارة ، فهذا التحدي هو عظيم ، مما يعني أن القيادة التلقائية لا يمكن أن تستخدم مثل هذا النموذج الكبير ومثل هذا الحساب الكبير.
أدى استهلاك الطاقة الحاسوبية من قبل النماذج الكبيرة إلى أن تصبح الشركات المصنعة للحوسبة السحابية الدفعة الأولى من اللاعبين الذين يتمتعون بأرباح في هذه الموجة من طفرة الذكاء الاصطناعي. كما أن تطوير الشركات الكبرى للحوسبة السحابية يفتح الطريق أمام النماذج الكبيرة. لكن في نهاية السيارة ، سيكون هذا تناقضًا.
المشكلة الأكبر هي أنه لم يتم التحقق من موثوقية النماذج الكبيرة.
يعرف الأشخاص الذين استخدموا ChatGPT أن ChatGPT يتحدث أحيانًا عن هراء ، وأحيانًا يكون على صواب وأحيانًا خاطئ. يُعرف هذا في الصناعة بالميل نحو الهلوسة ، والميل إلى إنتاج محتوى غير واقعي ليس له أصل على الإطلاق. النماذج الكبيرة تصنع الأشياء دون الاهتمام بصدقها ودقتها.
قد تكون الدردشة هراء ، لكن القيادة التلقائية لا تفعل ذلك. قد تكون نتيجة أي إخراج خاطئ مميتة.
قال يو كاي: "لقد أحرزت ChatGPT تقدمًا كبيرًا ، لكن القيادة التلقائية لم تأت بعد ، لأن القيادة التلقائية ، وخاصة القيادة بدون طيار ، قد يكون لها معدل تسامح صفري مع الخطأ ، وهي مسألة حياة أو موت".
يعتقد Long Zhiyong ، الذي شغل سابقًا منصب مدير العمليات في شركة AI ناشئة في Silicon Valley ، أن التهديدات التي لا يمكن السيطرة عليها ولا يمكن التنبؤ بها ولا يمكن الاعتماد عليها هي أكبر التهديدات لتسويق النماذج الكبيرة. أحد المظاهر النموذجية هو أن النموذج الكبير يميل إلى الهلوسة.
الآن ، ليس من الواقعي أن يتعلم نظام القيادة الأوتوماتيكي الاختيار والتمييز ، وإخراج الحل الأمثل بثبات.
قال أحد المطلعين على شركة ذكاء اصطناعي لشركة Shentu: "هناك بالفعل العديد من الاختراقات في الإدراك البصري على مستوى الخوارزمية. لكن مشهد السيارة متطلب للغاية. أنا شخصياً لا أعتقد أنه سيكون هناك اختراق كبير على المدى القصير . يمكنك الانتباه إلى حركات Sla الخاصة ".
ومع ذلك ، كان هناك مؤخرًا اتجاه في دائرة التكنولوجيا يتمثل في رغبة الشركات ، كبيرة وصغيرة ، في إلقاء نظرة على النقاط الساخنة في GPT. أعلن بعض مصنعي السيارات أنهم على وشك تطبيق تقنية تشبه GPT ، ومجموعة من المفاهيم الرائعة تجعل الناس في حيرة من أمرهم.
على سبيل المثال ، أصدرت شركة قيادة ذاتية تابعة لشركة سيارات تقليدية نموذجًا توليديًا كبيرًا للقيادة الذاتية ، والذي يُطلق عليه "الأول في الصناعة" الذي يستخدم هذا النموذج لتدريب القيادة الذاتية.
سأل مستثمر كان يهتم بمسار السيارات الذكية لفترة طويلة أحد رواد الصناعة عن رأيه في النموذج ، وأجاب الطرف الآخر بأربع كلمات: "هراء TM".
علق المستثمر على Shentu: "إنه مجرد عمل علاقات عامة".
القيادة الذاتية ، هل سيتم قلبها وإعادة تشغيلها؟
بقيادة تسلا ، إلى جانب موجة الذكاء الاصطناعي الناشئة هذا العام ، تقترب صناعة القيادة المستقلة تدريجياً من اتجاه النماذج الكبيرة ، وقوة الحوسبة الكبيرة ، والبيانات الضخمة.
لم يكن تأثير النماذج الكبيرة على القيادة الذاتية قاسياً بما فيه الكفاية ، لكن الأشخاص الذين لديهم حاسة شم قوية أظهروا تناقضاً.
تمامًا مثلما استخدم Tesla Transformer لتحويل بيانات الكاميرا المتعددة من مساحة الصورة إلى مساحة BEV ، لم يتردد في الإطاحة بالبنية الأصلية وإعادة كتابة الخوارزمية. قد يعني تطبيق النماذج الكبيرة الآن أيضًا أنه سيتم الإطاحة بخوارزمية القيادة التلقائية الأصلية وإعادة تشغيلها.
يعتقد He Zhiqiang أن النماذج الكبيرة سيكون لها تأثير كبير على القيادة الذاتية. في الماضي ، تم استخدام العديد من النماذج الصغيرة للقيادة الذاتية ، لكنها أصبحت الآن نموذجًا كبيرًا ، وقد يكون من الضروري القيام بذلك مرة أخرى. سيتم إعادة تنظيم صناعة القيادة الذاتية.
أخبر Zhao Dongxiang ، مدير القيادة الذاتية في شركة شرائح الذكاء الاصطناعي ، Shentu أن التغيير الشامل من طرف إلى طرف يعادل القيام بذلك مرة أخرى.
الخلط فرصة للوافدين الجدد وتهديد للقادة. غالبًا ما تحدث قصة التجاوز على منحنى في فترة التغير التكنولوجي السريع. في عصر التكنولوجيا السريعة ، كلما زاد الاستثمار في المسار القديم ، زادت التكلفة الغارقة ، وزادت صعوبة التحول. بالنسبة لمصنعي المعدات الأصلية أو شركات القيادة المستقلة ، لتبني تقنية جديدة ، لا يجب مراعاة التأثير فحسب ، بل التكلفة أيضًا.
قال Zhao Dongxiang أنه فيما يتعلق بالمرحلة الحالية ، لا معنى لتغيير المسار التقني للقيادة الأوتوماتيكية. "الآن القدرات التقنية للصناعة ليست سيئة. لقد أنفق الجميع الكثير من المال وفعلوا ذلك لفترة طويلة. إذا كان هناك لا يمثل تحسنا جوهريا ، ولا يوجد دافع للتغيير ".
في AI DAY في نهاية العام الماضي ، قامت Tesla بترقية BEV إلى شبكة إشغال (شبكة إشغال) ، وتم تحسين قدرة التعميم بشكل أكبر. من خلال احتلال الشبكة ، يمكن لنظام إدراك الطيار الآلي في Tesla أن يقرر ما إذا كان يحتاج إلى تجنبه دون معرفة الشيء الذي يراه ، وبالتالي حل المزيد من المشكلات طويلة الذيل.
بغض النظر عن نوع المسار التقني ، فإنه يخضع الآن لتغييرات وتكرارات سريعة. يمكن استبدال النماذج الصغيرة في الماضي بنماذج كبيرة ، ويمكن أيضًا استبدال النماذج الكبيرة الحالية ببعض الأنواع الجديدة في المستقبل.
ولكن على أي حال ، فإن ممارسة فرك النقاط الساخنة وصنع الحيل لا تساعد على التقدم التكنولوجي. قال تشاو دونغشيانغ: "إنها عادة سيئة أن تتبع الحرارة ، ومن المفيد صنع منتجات بطريقة واقعية".
إن "القنبلة الملكية" الحقيقية للقيادة الذاتية بعيدة كل البعد عن أن تأتي. ما يتعين علينا القيام به هو أن نبقى في حالة من الرهبة من كل جولة من التغيير التكنولوجي. لا تستطيع GPT الأسطورية بناء سيارة أحلامك ، ولكن على الأقل ، حدثت تغييرات.