AI üniversite giriş sınavında kaç puan alabilir? ChatGPT 4 ve Wenxin Yiyan'ın sonuçlarına bir göz atın

Orijinal kaynak: Hardcore Kanban

Resim kredisi: Sınırsız AI‌ tarafından oluşturuldu

Kısa bir süre önce AI üniversite giriş sınavı denemeleri tarafından patlatılan sıcak aramayı hatırlıyor musunuz?

Bazı insanlar AI'nın yazma seviyesinin çoğu insanı geçtiğini düşünürken, bazı insanlar AI'nın testte sadece 0 puan alabileceğini söylüyor.

Üniversiteye giriş sınavının sonuçları açıklanmaya başlandı ve AI puanlarını da bulduk...

Bu kez iki yapay zeka yarışmacısı Microsoft'tan ChatGPT-4 ve Baidu'dan Wen Xin Yi Yan.

Ulusal Rapor A'nın kompozisyon sorularını yanıtladıktan sonra, farklı bölgelerden üç öncü öğretmen üniversiteye giriş sınavının notunu simüle etti ve puanladı.

Yanıtlama hızı açısından Wenxin Yiyan daha da iyi, 29 saniyede 1103 kelime yazarken, Chat GPT-4 1 dakika 42 saniyede yalnızca 846 kelime yazdı.

Yazma açısından, Wen Xinyiyan'ın kompozisyonu birçok ünlü alıntıdan alıntı yapıyor, birçok örnek veriyor ve "zamanı benim için çalıştırmanın" üç yöntemini veriyor;

Sohbet GPT-4 önce teknolojinin getirdiği yaşam kolaylığını teyit etmiş, ardından teknolojinin insanları nasıl köleleştirdiğinden bahsetmiş ve son olarak teknolojiyi seçici kullanmayı ve zamanı rasyonel ayarlamayı önermiştir.

Sizce hangisi daha yüksek puan alır?

**Tam puan 60 puan olup, öğretmenlerin Chat GPT'ye verdiği ortalama puan 36 puandır. **

| Tatmin edici olmayan bir yazı olduğu söylenebilir, bu yazı da bir düşünce yapısındaki bir kusuru öne çıkarıyor;

| Alakalı olmasına rağmen, makalenin tamamı etkili ve inandırıcı bir argümandan yoksundur;

| Malzeme olgusunu genişletmek için yaratmak yerine çok fazla geçersiz alan kullanmak. Çoğu doğru saçmalık ve gerçekten yapıcı, işlevsel ve sorunlu noktaları vurabilecek çok az şey var.

Wen Xinyiyan'ın ortalama puanı 42 olan makalesine tekrar bakın. Puanlama öğretmenlerinin söyledikleri:

| En edebi yeteneklere ve en ayrıntılı argümanlara sahip olanıdır, ancak çok fazla alıntı yapmanın özellikle iyi olmadığını bilmeliyiz;

| Bu alıntılar, ayetler ve birçok örnek içinde kullanılmış olsa da birçoğu birçok adayın kullanmayı sevdiği örneklerdir, örneğin Yasak Şehir'deki kültürel kalıntıları tamir ediyorum;

| Örnek çok iyi ama insan ve zaman arasındaki ilişkiyi net bir şekilde anlatmıyor;

| Yazmak istediğim yerde yazmak istediğim, mantığın sağlam olmadığı ve puanının yüksek olmayacağı aşikar çünkü yapısı çok eski ve yazının tamamı temel olarak kanıtlardan ziyade kanıtlara dayalı. mantıktan daha.

Kolej giriş sınavının not standartlarına göre, mükemmel bir üniversite giriş sınavı kompozisyonu (birinci kategori makale) genellikle 50 puan veya üzerinde puan alır.

Farklı bölgelerden üç öğretmen genel olarak yüksek veya düşük puanlara sahip olsa da, genel ortalama sonuç yine de şunu gösterir:

**Yüksek yazma hızına sahip iki AI adayı sadece orta seviye olarak kabul edilebilir. **

Makaleyi algoritmaya göre tamamlamak, önceki üniversite giriş sınavı kompozisyonumuzdaki uzun süredir devam eden eksikliklerin çoğunu miras alacaktır.Herkes için iyi görünen birçok makale, üniversite giriş sınavı için mevcut ihtiyaçlarımızı yavaş yavaş artık karşılamamaktadır.

Bu fırsatı değerlendirerek sessizce bir "Turing Testi" de gerçekleştirdik.

İki AI bestesine ek olarak, gerçek bir kişi tarafından yazılmış bir beste de öğretmenlerin farkı anlayıp anlamadıklarını görmek için not veren öğretmenlere teslim edildi.

Gerçek kişinin kompozisyonunun açılış argümanı "Teknolojiye körü körüne güvenir ve zamanın kölesi olursanız, o zaman teknolojinin gelişmesi anlamsız olacaktır";

Genel olarak, teknolojiye kendinizi kaptırıp faydalarından yararlanamayacağınızı ve teknolojik gelişme eğilimine körü körüne direnemeyeceğinizi söylüyor.Teknolojiyi kullanmak ve kendinizi kontrol etmeyi öğrenmek için "ılımlı" düşünmeyi kullanmalısınız.

**Öğretmenler, aşağıdaki nedenlerle AI'yı az farkla geride bırakan gerçek bir kişinin kompozisyonu olduğunu bilmeden ortalama 43 puan aldılar:

  • okuyabildiğim tek şey, ancak bu makaledeki sorun, odağı yanlış yerleştirmesi. Konunun kendisi hakkındaki tüm anlayışı biraz önyargılı, bu yüzden aslında kısmi bir konuya sahip bir alt başlık. orospu çocuğu .
  • Bir beyefendi bir şeyleri kandırmakta iyidir, sadece insanların öğrenmede ve yabancı şeyler yardımıyla öğrenmede iyi olması gerektiğini söyleyerek;
  • Makalenin tamamının yapısı, soruları gündeme getirme ve analiz etme sürecinde, insan ve teknoloji arasındaki ilişkiye daha fazla dikkat etti ve zaman unsurunu zayıflattı;
  • Gerçek eyleme geçirilebilir argümanlar bulmak için çok geç.

"Distinguish Real People's Composition" bağlantısında, Chat GPT-4 kompozisyonundaki bariz İngilizce-Çince çeviri izleri onun gerçek kimliğini ortaya çıkardı ve önce öğretmenler tarafından dışlandı.

Wen Xinyiyan'ın eserleri daha kafa karıştırıcı ve üç öğretmenin hepsi bu eserin gerçek bir insandan olup olmadığını merak etti. Bunun nedeni, öğretimde klasikleri alıntılayarak ve retoriği yığarak yüksek not almak isteyen birçok öğrenciye de rastlamış olmalarıdır.

Bu savaştan sonra, herkes yapay zekanın konunun anlamına yakından yazmasının zor olduğunu fark etmiş olmalı; daha güçlü ıraksak düşünceye sahip insanlar, derinlemesine düşünürken kaçınılmaz olarak "çok fazla düşünme" tuzağına düşeceklerdir. **Mevcut yapay zeka, insan düşüncesi için pastanın üzerindeki kremadan başka bir şey değil; **Yetenek seçiminin önemli bir parçası olan üniversiteye giriş sınavı da sürekli gelişiyor. Ancak o zaman daha da iyi oluyor. **

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin