كم عدد النقاط التي يمكن أن يحصل عليها الذكاء الاصطناعي في امتحان القبول بالكلية؟ ألق نظرة على نتائج ChatGPT 4 و Wenxin Yiyan

المصدر الأصلي: Hardcore Kanban

رصيد الصورة: تم إنشاؤه بواسطة Unbounded AI‌

هل تتذكر البحث الساخن الذي تم تفجيره بواسطة مقالات امتحان القبول بالكلية لمنظمة العفو الدولية منذ وقت ليس ببعيد؟

يعتقد بعض الناس أن مستوى الكتابة في الذكاء الاصطناعي قد تجاوز معظم الأشخاص ، ويقول البعض إن الذكاء الاصطناعي لا يمكنه الحصول إلا على 0 نقطة في الاختبار

بدأت نتائج امتحان القبول بالكلية في الظهور ، ووجدنا أيضًا درجات الذكاء الاصطناعي ...

المتنافسان على الذكاء الاصطناعي هذه المرة هما ** ChatGPT-4 ** من Microsoft و ** Wen Xin Yi Yan ** من Baidu.

بعد أن أجابوا على أسئلة التكوين الخاصة بالورقة الوطنية أ ، قام ثلاثة مدرسين في الخطوط الأمامية من مناطق مختلفة بمحاكاة وضع العلامات على امتحان القبول بالكلية وسجلوها.

** من منظور سرعة الرد ، فإن Wenxin Yiyan أفضل من ذلك ** ، حيث كتب 1103 كلمة في 29 ثانية ؛ بينما كتب Chat GPT-4 846 كلمة فقط في دقيقة واحدة و 42 ثانية.

من وجهة نظر الكتابة ، يقتبس تكوين Wen Xinyiyan الكثير من الاقتباسات الشهيرة ، ويقدم العديد من الأمثلة ، ويعطي ثلاث طرق لـ "جعل الوقت يعمل بالنسبة لي" ؛

أكد Chat GPT-4 أولاً راحة الحياة التي توفرها التكنولوجيا ، ثم تحدث عن كيف تجعل التكنولوجيا الناس عبيدًا ، واقترح أخيرًا استخدام التكنولوجيا بشكل انتقائي وترتيب الوقت بعقلانية.

أيهما تعتقد أنه سيسجل أعلى؟

** النتيجة الكاملة هي 60 نقطة ، ومتوسط الدرجات التي يمنحها المعلمون إلى Chat GPT هو 36 نقطة. **

** | ** يمكن القول إنها مقالة غير مرضية ، فهذه المقالة تسلط الضوء أيضًا على خلل في نمط التفكير ؛

** | ** على الرغم من أهميتها ، تفتقر المقالة بأكملها إلى حجة فعالة وذات مصداقية ؛

** | ** استخدام الكثير من المساحة غير الصالحة لتوسيع ظاهرة المادة نفسها ، بدلاً من الإبداع. معظمها هراء صحيح ، وهناك عدد قليل جدًا منها يكون بناءً وعمليًا وقادرًا على الوصول إلى نقاط الألم.

** انظر إلى مقالة Wen Xinyiyan مرة أخرى ، بمتوسط درجة 42 **. وإليك ما قاله مدرسو التصحيح:

** | ** إنها أكثر المواهب الأدبية والحجج الأكثر تفصيلاً ، لكن يجب أن نعلم أنه ليس من الجيد الاقتباس كثيرًا ؛

** | ** على الرغم من استخدام الكثير من هذه الاقتباسات والآيات والعديد من الأمثلة فيها ، إلا أن العديد منها أمثلة يحبها العديد من المرشحين ، مثل أنا أقوم بإصلاح الآثار الثقافية في المدينة المحرمة ؛

** | ** المثال جيد جدًا ، لكنه لا يشرح بوضوح العلاقة بين الناس والزمن ؛

** | ** من الواضح أنني أريد أن أكتب حيث أريد أن أكتب ، فالمنطق ليس قوياً ، ولن تكون النتيجة عالية ، لأن هيكله قديم للغاية ، والمقال بأكمله مدفوع بالأدلة بدلاً من ذلك من المنطق.

وفقًا لمعايير وضع العلامات لامتحان القبول بالكلية ، فإن تركيبة امتحان القبول بالجامعة الممتازة (مقال من الفئة الأولى) تسجل عمومًا 50 نقطة أو أعلى.

على الرغم من أن المعلمين الثلاثة من مناطق مختلفة قد يكون لديهم درجات عالية أو منخفضة بشكل عام ، إلا أن متوسط النتيجة الإجمالي لا يزال يظهر:

** لا يمكن اعتبار مرشحي الذكاء الاصطناعي اللذين يتمتعان بسرعة كتابة عالية إلا بمستوى متوسط. **

سوف يرث إكمال المقال وفقًا للخوارزمية العديد من أوجه القصور الطويلة الأمد في تكوين امتحان القبول بالجامعة السابق ، فالعديد من المقالات التي تبدو جيدة للجميع لم تعد تلبي الاحتياجات الحالية لامتحان القبول بالجامعة.

اغتنمنا هذه الفرصة ، أجرينا أيضًا بهدوء ** "اختبار تورينج" **.

بالإضافة إلى مؤلفي الذكاء الاصطناعي ، تم أيضًا تسليم تركيبة كتبها شخص حقيقي إلى معلمي العلامات لمعرفة ما إذا كان بإمكان المعلمين معرفة الفرق.

الحجة الافتتاحية لتكوين الشخص الحقيقي هي "إذا اعتمدت بشكل أعمى على التكنولوجيا وأصبحت عبداً للوقت ، فإن تطوير التكنولوجيا سيكون بلا معنى" ؛

بشكل عام ، تقول أنه لا يمكنك الانغماس في التكنولوجيا والاستمتاع بالمزايا ، ولا يمكنك مقاومة اتجاه التطور التكنولوجي بشكل أعمى.يجب استخدام التفكير "المعتدل" لاستخدام التكنولوجيا وتعلم التحكم في نفسك.

** سجل المدرسون 43 نقطة في المتوسط دون أن يعلموا أنها كانت تركيبة شخص حقيقي ، والتي تغلبت بفارق ضئيل على الذكاء الاصطناعي ** ، للأسباب التالية:

  • هي الوحيدة التي يمكنني قراءتها ، لكن المشكلة في هذه المقالة هي أنها أخطأت في التركيز. فهمه لمراجعة الموضوع نفسه متحيز بعض الشيء ، لذلك فهو في الواقع عنوان فرعي مع موضوع جزئي. ابن عاهرة.
  • الرجل بارع في خداع الأشياء ، فقط يقول أن الناس يجب أن يكونوا جيدين في التعلم والتعلم بمساعدة الأشياء الغريبة ؛
  • هيكل المقال بأكمله ، في عملية طرح الأسئلة وتحليلها ، أولى اهتمامًا أكبر للعلاقة بين الناس والتكنولوجيا ، وأضعف عنصر الوقت ؛
  • الحجج الحقيقية القابلة للتنفيذ فات الأوان للخروج بها.

في رابط ** "تمييز تكوين الأشخاص الحقيقيين" ** ، كشفت آثار الترجمة الإنجليزية-الصينية الواضحة في تركيبة Chat GPT-4 عن هويتها الحقيقية ، وتم استبعادها لأول مرة من قبل المعلمين.

تعتبر أعمال Wen Xinyiyan أكثر إرباكًا ، وقد تساءل المعلمون الثلاثة عما إذا كان هذا العمل من شخص حقيقي. والسبب هو أنهم واجهوا أيضًا العديد من الطلاب الذين يرغبون في الحصول على درجات عالية من خلال الاستشهاد بالكلاسيكيات وتراكم البلاغة في التدريس.

بعد هذه المعركة ، يجب أن يكون الجميع قد لاحظوا أنه من الصعب على الذكاء الاصطناعي الكتابة عن كثب لمعنى الموضوع ؛ فالبشر الذين لديهم تفكير متباين أقوى سوف يقعون حتماً في فخ "الإفراط في التفكير" عند التفكير بعمق. ** لا يزال الذكاء الاصطناعي الحالي مجرد كعكة على شكل كعكة للتفكير البشري ؛ ** كجزء مهم من اختيار المواهب ، يتطور امتحان القبول بالجامعة باستمرار ، وعندها فقط يصبح أفضل. **

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت