通義千問:更新フラッグシップ版Qwen3モデル 汎用能力の著しい向上

robot
概要作成中

Jin10データ7月22日、通義千問:今日は、フラッグシップ版Qwen3モデルを更新し、Qwen3-235B-A22B-FP8非思考モード(Non-thinking)の更新版を発表しました。新しいQwen3モデルは、指示遵守、論理推論、テキスト理解、数学、科学、プログラミングおよびツール使用などの分野で、汎用能力が大幅に向上しました。GQPA(知識)、AIME25(数学)、LiveCodeBench(プログラミング)、Arena-Hard(人間の好みの調整)、BFCL(エージェント能力)などの多くの評価で、Kimi-K2、DeepSeek-V3などのトップオープンソースモデルやClaude-Opus4-Non-thinkingなどの先進的なクローズドソースモデルを上回る優れた性能を発揮しました。

AGENT10.37%
DEEPSEEK-5.36%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)