AIは大学入試で何点取れるのでしょうか？ ChatGPT 4 と Wenxin Yiyan の結果を見てみましょう

Question

元のソース: ハードコア カンバン![](https://img.gateio.im/social/moments-bab2147faf-e4f2c7b3dd-dd1a6f-62a40f) 画像クレジット: Unbounded AI によって生成‌少し前に AI 大学入学試験の小論文によって爆発的に流行した検索を覚えていますか?AIの作文レベルはほとんどの人を超えていると考える人もいるし、AIはテストで0点しか取れないと言う人もいる大学入試の結果が出始め、AIの得点も判明しました…。今回の AI 出場者は、Microsoft の **ChatGPT-4** と Baidu の **Wen Xin Yi Yan ** の 2 人です。全国論文Ａの作文問題を解答した後、各地の第一線の教員３名が大学入試の採点を模擬して採点した。![](https://img.gateio.im/social/moments-bab2147faf-a48b1465e5-dd1a6f-62a40f) **回答速度の観点から見ると、Wenxin Yiyan はさらに優れています**。29 秒で 1103 ワードを書きましたが、Chat GPT-4 は 1 分 42 秒で 846 ワードしか書きませんでした。文章を書くという観点から見ると、Wen Shinyiyan の作文は多くの有名な引用を引用し、多くの例を挙げ、「時間を有効に活用する」ための 3 つの方法を示しています。![](https://img.gateio.im/social/moments-bab2147faf-63c67a63bc-dd1a6f-62a40f) チャット GPT-4 は、まずテクノロジーによってもたらされる生活の利便性を肯定し、次にテクノロジーがいかに人間を奴隷にするかについて語り、最後にテクノロジーを選択的に使用し、時間を合理的に配置することを提案しました。![](https://img.gateio.im/social/moments-bab2147faf-a916ecdb3c-dd1a6f-62a40f) どちらの方が得点が高いと思いますか?**フルスコアは 60 ポイントで、Chat GPT に対して教師が与えた平均スコアは 36 ポイントです。 ****|** 不十分な記事と言えますが、この記事も思考パターンの欠陥を浮き彫りにしています。**|** 関連性はあるものの、記事全体には効果的で信頼できる議論が欠けています。**|** マテリアル自体の現象を作成するのではなく、拡張するために無効なスペースを多用しすぎています。それらのほとんどは正しいナンセンスであり、実際に建設的で実用的で、問題点を解決できるものはほとんどありません。![](https://img.gateio.im/social/moments-bab2147faf-366b65991a-dd1a6f-62a40f) **Wen Xinyiyan の記事をもう一度見てください。平均点は 42 です**。採点教師のコメントは次のとおりです。**|** それは最も文才があり、最も詳細な議論を持っている人ですが、あまり引用するのは特に良くないことを知っておく必要があります。**|** その中では、これらの引用、詩、多くの例がたくさん使用されていますが、それらの多くは、多くの候補者が好んで使用する例です。**|** この例は非常に優れていますが、人と時間の関係を明確に説明していません。**|** 書きたいところに書きたいのは明らかで、論理が弱く、スコアも高くありません。構成が古すぎるためです。記事全体が基本的に証拠に基づいています。論理よりも。![](https://img.gateio.im/social/moments-bab2147faf-361b2b4d43-dd1a6f-62a40f) 大学入学共通テストの採点基準によれば、優れた大学入学試験作文（第一種小論文）は、原則として50点以上を獲得することとされています。異なる地域の 3 人の教師の全体的なスコアは高いか低い可能性がありますが、全体的な平均結果は次のようになります。**書き込み速度が速い 2 つの AI 候補は中レベルとしか考えられません。 **アルゴリズムに従って記事を完成させることは、これまでの大学入試作文の長年の欠点を多く引き継いでおり、誰にとっても良さそうな記事の多くが、徐々に現在の大学入試のニーズを満たさなくなってきています。![](https://img.gateio.im/social/moments-bab2147faf-e3fd1c9fe1-dd1a6f-62a40f) これを機に、私たちもひっそりと**「チューリングテスト」**を実施しました。2 つの AI 作文に加えて、実際の人間が書いた作文も採点教師に渡され、教師が違いを区別できるかどうかが確認されました。![](https://img.gateio.im/social/moments-bab2147faf-09ed493f5c-dd1a6f-62a40f) 実在の人物の作文の冒頭の主張は、「テクノロジーに盲目的に依存し、時間の奴隷になってしまっては、テクノロジーの発展は無意味になってしまう」というものです。全体的には、テクノロジーに耽溺してその恩恵を享受することはできず、テクノロジーの発展の流れに盲目的に抵抗することはできず、「中庸」の思考を持ってテクノロジーを利用し、自分自身をコントロールすることを学ばなければならない、と書かれています。![](https://img.gateio.im/social/moments-bab2147faf-6adf1a63d9-dd1a6f-62a40f) **教師たちは、それが実際の人物の作文であることを知らずに平均 43 点を獲得し、僅差で AI を上回りました**。その理由は次のとおりです。* しか読めませんが、この記事の問題は焦点がずれていることです。トピック自体のレビューに対する彼の理解が少し偏っているため、実際にはトピックの一部をサブタイトルにしています。雌犬。* 君子は物事をだますのが上手で、人々は外国のものの助けを借りて学び学ぶのが得意であるべきだとだけ言っています。* 記事全体の構成、問題提起と分析の過程で、彼は人間とテクノロジーの関係により多くの注意を払い、時間の要素を弱めました。* 実際に実行可能な議論を思いつくには遅すぎます。![](https://img.gateio.im/social/moments-bab2147faf-549f7854ec-dd1a6f-62a40f) **「本物の人物の作文を区別する」** のリンクで、チャット GPT-4 作文内の明らかな英語-中国語の翻訳トレースによりその正体が暴露され、教師によって最初に除外されました。ウェン・シンイーヤンの作品はさらに複雑で、3人の教師は全員、この作品が実在の人物によるものかどうか疑問に思っている。なぜなら、古典を引き合いに出し、レトリックを積み上げて指導することで高得点を得ようとする生徒も多く遭遇したからである。![](https://img.gateio.im/social/moments-bab2147faf-0847fd4414-dd1a6f-62a40f) この戦いを経て、AIがテーマの意味に忠実に書くのは難しく、発散思考の強い人間は深く考えると必ず「考えすぎ」の罠に陥ることに誰もが気づいたはずだ。 **現在の AI は、まだ人間の思考にとっては飾りにすぎません; **人材選抜の重要な部分として、大学入学試験も常に進化しています。 **