Скільки балів ШІ може отримати на вступному іспиті до коледжу? Подивіться на результати ChatGPT 4 і Wenxin Yiyan

Оригінальне джерело: Hardcore Kanban

Кредит зображення: створено Unbounded AI‌

Пам’ятаєте гарячий пошук, який нещодавно підірвався після вступних іспитів до коледжу зі штучним інтелектом?

Деякі люди вважають, що рівень письма ШІ перевершив більшість людей, а деякі люди кажуть, що ШІ може отримати лише 0 балів у тесті

Почали публікуватися результати вступних іспитів до коледжу, а також ми знайшли бали ШІ...

Цього разу двома учасниками ШІ є ChatGPT-4 від Microsoft і **Wen Xin Yi Yan ** від Baidu.

Після того, як вони відповіли на складові запитання національного аркуша A, троє вчителів із різних регіонів змоделювали оцінювання вступного іспиту до коледжу та поставили їм бали.

З точки зору швидкості відповіді, Wenxin Yiyan навіть кращий, написав 1103 слова за 29 секунд, тоді як Chat GPT-4 написав лише 846 слів за 1 хвилину 42 секунди.

З точки зору письма, композиція Вень Сіньяня цитує багато відомих цитат, наводить багато прикладів і дає три методи «змусити час працювати на мене»;

Чат GPT-4 спочатку стверджував зручність життя, яку приносять технології, потім розповідав про те, як технології роблять людей рабами, і, нарешті, запропонував використовувати технології вибірково та раціонально розподіляти час.

Як ви думаєте, хто отримає більше балів?

**Повна оцінка становить 60 балів, а середня оцінка, надана викладачами Chat GPT, становить 36 балів. **

| Можна сказати, що це незадовільна стаття. Ця стаття також підкреслює недолік у моделі мислення;

| Незважаючи на доречність, у всій статті не вистачає ефективного та достовірного аргументу;

| Використання занадто великого недійсного простору для розширення явища самого матеріалу замість створення. Більшість із них — правильна нісенітниця, а справді конструктивних, оперативних і здатних вразити больові точки надто мало.

Знову подивіться на статтю Вень Сіньянь із середнім балом 42. Ось що сказали вчителі оцінювання:

| Це той, хто має найбільше літературних талантів і найдетальніші аргументи, але ми повинні знати, що не дуже добре цитувати занадто багато;

| Хоча в ньому використано багато цитат, віршів і багато прикладів, багато з них є прикладами, які люблять використовувати багато кандидатів, наприклад, я ремонтую культурні реліквії в Забороненому місті;

| Приклад дуже хороший, але він не чітко пояснює зв'язок між людьми та часом;

| Очевидно, що я хочу писати там, де я хочу, логіка слабка, і оцінка не буде високою, тому що його структура надто стара, а вся стаття в основному скоріше керується доказами ніж логіка.

Згідно зі стандартами вступного іспиту до коледжу, відмінний твір вступного іспиту до коледжу (твір першої категорії) зазвичай набирає 50 балів або вище.

Хоча три вчителі з різних регіонів можуть мати загальні високі або низькі бали, загальний середній результат все одно показує:

**Два кандидати ШІ з високою швидкістю запису можна вважати лише середнім рівнем. **

Заповнення статті відповідно до алгоритму успадкує багато давніх недоліків у нашому попередньому складі вступних іспитів до коледжу.Багато статей, які здавалися всім хорошими, поступово перестали відповідати нашим поточним потребам для вступних іспитів до коледжу.

Користуючись цією нагодою, ми також тихо провели "тест Тюрінга".

Окрім двох композицій штучного інтелекту, твір, написаний реальною людиною, також було передано вчителям, які оцінювали, щоб перевірити, чи зможуть вчителі відрізнити їх.

Початковий аргумент твору реальної людини: «Якщо ви сліпо покладаєтеся на технології і стаєте рабами часу, то розвиток технологій буде безглуздим»;

Загалом, це говорить про те, що ви не можете захоплюватися технологіями та насолоджуватися перевагами, і ви не можете сліпо чинити опір тенденціям технологічного розвитку, ви повинні використовувати «помірковане» мислення, щоб використовувати технології та навчитися контролювати себе.

Вчителі набрали в середньому 43 бали, не знаючи, що це композиція реальної людини, яка трохи перевершила ШІ з таких причин:

  • це єдиний, який я можу прочитати, але проблема цієї статті полягає в тому, що вона неправильно розташувала фокус. Його розуміння огляду самої теми є дещо упередженим, тому це насправді підзаголовок із частковою темою. син сука.
  • Пан добре вміє обманювати речі, тільки кажучи, що люди повинні вміти вчитися і вчитися за допомогою сторонніх предметів;
  • Структура всієї статті, у процесі постановки та аналізу питань, він приділив більше уваги відносинам між людьми та технологією та послабив елемент часу;
  • Справжні дієві аргументи придумати надто пізно.

У посиланні "Розрізняти композицію справжніх людей" очевидні сліди англійсько-китайського перекладу в композиції Chat GPT-4 показали її справжню ідентичність, і її спочатку виключили вчителі.

Твори Вень Сіньяня більш заплутані, і всі троє вчителів задавалися питанням, чи ця робота написана реальною людиною. Причина в тому, що вони також стикалися з багатьма студентами, які хотіли отримати високі бали, цитуючи класику та нагромаджуючи риторику під час викладання.

Після цієї битви всі, мабуть, помітили, що штучному інтелекту важко чітко розповісти про зміст теми; люди з сильнішим дивергентним мисленням неминуче потраплять у пастку «занадто багато думати», коли міркують глибоко. **Поточний штучний інтелект – це лише вишенька на торті для людського мислення; **Як важлива частина відбору талантів, вступний іспит до коледжу також постійно розвивається. Тільки тоді він стає ще кращим. **

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити