Le nouveau codeur IA d'Alibaba a surpassé DeepSeek

2025-07-23 02:47:12

Le nouveau codeur IA d'Alibaba a surpassé DeepSeek

La société Alibaba a lancé « l'outil d'IA le plus avancé pour la programmation » — un modèle d'IA open source Qwen3-Coder.

Qwen3-Coder est ici! ✅

Nous lançons Qwen3-Coder-480B-A35B-Instruct, notre modèle de code agentique ouvert le plus puissant à ce jour. Ce modèle Mixture-of-Experts de 480B paramètres (35B active) prend en charge nativement 256K de contexte et s’étend à 1M de contexte avec extrapolation. Il atteint… pic.twitter.com/Z8HfyrVScE

— Qwen (@Alibaba_Qwen) 22 juillet 2025

Le réseau de neurones est conçu pour des tâches liées à la programmation. Il est capable d'écrire du code et de gérer des processus de travail complexes, montrant des progrès dans d'autres domaines :

suivre les instructions;
pensée logique;
compréhension du texte;
mathématiques;
sciences naturelles;
utilisation des outils.

L'entreprise positionne le produit comme « particulièrement puissant » dans les tâches d'IA agent — lorsque l'intelligence artificielle est capable de travailler de manière autonome sans intervention humaine.

pic.twitter.com/M8krjTM4tq

— Qwen (@Alibaba_Qwen) 22 juillet 2025

Selon les données présentées, Qwen3-Coder a surpassé ses concurrents chinois, y compris les modèles de DeepSeek et K2 de Moonshot AI, sur plusieurs indicateurs. Ainsi, lors de l'Olympiade mathématique américaine, elle a obtenu 70,3 points contre 46,6 pour DeepSeek-V3-0324.

Dans le test de programmation MultiPL-E, le modèle linguistique a obtenu 87,9 points, tandis que DeepSeek a obtenu 82,2.

Dans certains domaines, le réseau de neurones est comparable à des équivalents américains avancés comme Claude d'Anthropic et GPT-4 d'OpenAI.

Le réseau de neurones Qwen3-235B-A22B-Instruct-2507-FP8 est une mise à jour de la version précédente Qwen3-235B-A22B-FP8, mais fonctionne en mode sans raisonnement - il produit un résultat sans déductions logiques étape par étape. Grâce à cela, la longueur maximale du contenu traité a été augmentée par huit - jusqu'à 256 000 tokens, ce qui permet de travailler avec des textes beaucoup plus volumineux dans le cadre d'un seul dialogue.

Rappelons qu'en mai, Alibaba a annoncé une percée dans la réduction du coût de formation des modèles d'IA axés sur la recherche.

DEEPSEEK0.77%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
1/3
1Simple Earn Annual Rate 24.4%
23k Popularité
2Gate Launchpad List IKA
30k Popularité
3ETH Trading Volume Surges
24k Popularité
4Gate ETH 10th Anniversary Celebration
20k Popularité
5Trump’s AI Strategy
18k Popularité

Épingler