Le nouveau codeur IA d'Alibaba a surpassé DeepSeek
La société Alibaba a lancé « l'outil d'IA le plus avancé pour la programmation » — un modèle d'IA open source Qwen3-Coder.
Qwen3-Coder est ici! ✅
Nous lançons Qwen3-Coder-480B-A35B-Instruct, notre modèle de code agentique ouvert le plus puissant à ce jour. Ce modèle Mixture-of-Experts de 480B paramètres (35B active) prend en charge nativement 256K de contexte et s’étend à 1M de contexte avec extrapolation. Il atteint… pic.twitter.com/Z8HfyrVScE
— Qwen (@Alibaba_Qwen) 22 juillet 2025
Le réseau de neurones est conçu pour des tâches liées à la programmation. Il est capable d'écrire du code et de gérer des processus de travail complexes, montrant des progrès dans d'autres domaines :
suivre les instructions;
pensée logique;
compréhension du texte;
mathématiques;
sciences naturelles;
utilisation des outils.
L'entreprise positionne le produit comme « particulièrement puissant » dans les tâches d'IA agent — lorsque l'intelligence artificielle est capable de travailler de manière autonome sans intervention humaine.
pic.twitter.com/M8krjTM4tq
— Qwen (@Alibaba_Qwen) 22 juillet 2025
Selon les données présentées, Qwen3-Coder a surpassé ses concurrents chinois, y compris les modèles de DeepSeek et K2 de Moonshot AI, sur plusieurs indicateurs. Ainsi, lors de l'Olympiade mathématique américaine, elle a obtenu 70,3 points contre 46,6 pour DeepSeek-V3-0324.
Dans le test de programmation MultiPL-E, le modèle linguistique a obtenu 87,9 points, tandis que DeepSeek a obtenu 82,2.
Dans certains domaines, le réseau de neurones est comparable à des équivalents américains avancés comme Claude d'Anthropic et GPT-4 d'OpenAI.
Le réseau de neurones Qwen3-235B-A22B-Instruct-2507-FP8 est une mise à jour de la version précédente Qwen3-235B-A22B-FP8, mais fonctionne en mode sans raisonnement - il produit un résultat sans déductions logiques étape par étape. Grâce à cela, la longueur maximale du contenu traité a été augmentée par huit - jusqu'à 256 000 tokens, ce qui permet de travailler avec des textes beaucoup plus volumineux dans le cadre d'un seul dialogue.
Rappelons qu'en mai, Alibaba a annoncé une percée dans la réduction du coût de formation des modèles d'IA axés sur la recherche.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Le nouveau codeur IA d'Alibaba a surpassé DeepSeek
Le nouveau codeur IA d'Alibaba a surpassé DeepSeek
La société Alibaba a lancé « l'outil d'IA le plus avancé pour la programmation » — un modèle d'IA open source Qwen3-Coder.
Le réseau de neurones est conçu pour des tâches liées à la programmation. Il est capable d'écrire du code et de gérer des processus de travail complexes, montrant des progrès dans d'autres domaines :
L'entreprise positionne le produit comme « particulièrement puissant » dans les tâches d'IA agent — lorsque l'intelligence artificielle est capable de travailler de manière autonome sans intervention humaine.
Selon les données présentées, Qwen3-Coder a surpassé ses concurrents chinois, y compris les modèles de DeepSeek et K2 de Moonshot AI, sur plusieurs indicateurs. Ainsi, lors de l'Olympiade mathématique américaine, elle a obtenu 70,3 points contre 46,6 pour DeepSeek-V3-0324.
Dans le test de programmation MultiPL-E, le modèle linguistique a obtenu 87,9 points, tandis que DeepSeek a obtenu 82,2.
Dans certains domaines, le réseau de neurones est comparable à des équivalents américains avancés comme Claude d'Anthropic et GPT-4 d'OpenAI.
Le réseau de neurones Qwen3-235B-A22B-Instruct-2507-FP8 est une mise à jour de la version précédente Qwen3-235B-A22B-FP8, mais fonctionne en mode sans raisonnement - il produit un résultat sans déductions logiques étape par étape. Grâce à cela, la longueur maximale du contenu traité a été augmentée par huit - jusqu'à 256 000 tokens, ce qui permet de travailler avec des textes beaucoup plus volumineux dans le cadre d'un seul dialogue.
Rappelons qu'en mai, Alibaba a annoncé une percée dans la réduction du coût de formation des modèles d'IA axés sur la recherche.