Jin10データ7月22日、通義千問:今日は、フラッグシップ版Qwen3モデルを更新し、Qwen3-235B-A22B-FP8非思考モード(Non-thinking)の更新版を発表しました。新しいQwen3モデルは、指示遵守、論理推論、テキスト理解、数学、科学、プログラミングおよびツール使用などの分野で、汎用能力が大幅に向上しました。GQPA(知識)、AIME25(数学)、LiveCodeBench(プログラミング)、Arena-Hard(人間の好みの調整)、BFCL(エージェント能力)などの多くの評価で、Kimi-K2、DeepSeek-V3などのトップオープンソースモデルやClaude-Opus4-Non-thinkingなどの先進的なクローズドソースモデルを上回る優れた性能を発揮しました。
通義千問:更新フラッグシップ版Qwen3モデル 汎用能力の著しい向上
Jin10データ7月22日、通義千問:今日は、フラッグシップ版Qwen3モデルを更新し、Qwen3-235B-A22B-FP8非思考モード(Non-thinking)の更新版を発表しました。新しいQwen3モデルは、指示遵守、論理推論、テキスト理解、数学、科学、プログラミングおよびツール使用などの分野で、汎用能力が大幅に向上しました。GQPA(知識)、AIME25(数学)、LiveCodeBench(プログラミング)、Arena-Hard(人間の好みの調整)、BFCL(エージェント能力)などの多くの評価で、Kimi-K2、DeepSeek-V3などのトップオープンソースモデルやClaude-Opus4-Non-thinkingなどの先進的なクローズドソースモデルを上回る優れた性能を発揮しました。