Novo codificador de IA da Alibaba superou o DeepSeek
A empresa Alibaba lançou a "ferramenta de IA para programação mais avançada" — o modelo de IA de código aberto Qwen3-Coder.
Qwen3-Coder está aqui! ✅
Estamos lançando Qwen3-Coder-480B-A35B-Instruct, nosso modelo de código aberto mais poderoso até hoje. Este modelo Mixture-of-Experts de 480B parâmetros (35B active) suporta nativamente 256K de contexto e escala para 1M de contexto com extrapolação. Ele alcança… pic.twitter.com/Z8HfyrVScE
— Qwen (@Alibaba_Qwen) 22 de julho de 2025
A rede neural é destinada a tarefas relacionadas à programação. Ela é capaz de escrever código e gerenciar workflows complexos, demonstrando progresso em outras áreas:
seguir as instruções;
pensamento lógico;
compreensão do texto;
matemática;
ciências naturais;
utilização de ferramentas.
A empresa posiciona o produto como "especialmente forte" em tarefas de IA de agente - quando a inteligência artificial é capaz de trabalhar de forma independente, sem intervenção humana.
pic.twitter.com/M8krjTM4tq
— Qwen (@Alibaba_Qwen) 22 de julho de 2025
De acordo com os dados apresentados, o Qwen3-Coder superou os concorrentes chineses, incluindo modelos da DeepSeek e K2 da Moonshot AI, em vários indicadores. Assim, na Olimpíada Americana de Matemática, ele obteve 70,3 pontos contra 46,6 da DeepSeek-V3-0324.
No teste de programação MultiPL-E, o modelo de linguagem obteve 87,9 pontos, enquanto o DeepSeek obteve 82,2.
Em algumas áreas, a rede neural é comparável a análogos americanos avançados, como o Claude da Anthropic e o GPT-4 da OpenAI.
A rede neural Qwen3-235B-A22B-Instruct-2507-FP8 é uma atualização da versão anterior Qwen3-235B-A22B-FP8, mas opera em modo sem raciocínio — fornece resultados sem deduções lógicas passo a passo. Graças a isso, o comprimento máximo do conteúdo processado aumentou em oito vezes — para 256 000 tokens, permitindo trabalhar com textos muito maiores dentro de um único diálogo.
Recordamos que, em maio, a Alibaba anunciou uma quebra na redução do custo de treinamento de modelos de IA voltados para a busca.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
O novo codificador de IA da Alibaba superou o DeepSeek
Novo codificador de IA da Alibaba superou o DeepSeek
A empresa Alibaba lançou a "ferramenta de IA para programação mais avançada" — o modelo de IA de código aberto Qwen3-Coder.
A rede neural é destinada a tarefas relacionadas à programação. Ela é capaz de escrever código e gerenciar workflows complexos, demonstrando progresso em outras áreas:
A empresa posiciona o produto como "especialmente forte" em tarefas de IA de agente - quando a inteligência artificial é capaz de trabalhar de forma independente, sem intervenção humana.
De acordo com os dados apresentados, o Qwen3-Coder superou os concorrentes chineses, incluindo modelos da DeepSeek e K2 da Moonshot AI, em vários indicadores. Assim, na Olimpíada Americana de Matemática, ele obteve 70,3 pontos contra 46,6 da DeepSeek-V3-0324.
No teste de programação MultiPL-E, o modelo de linguagem obteve 87,9 pontos, enquanto o DeepSeek obteve 82,2.
Em algumas áreas, a rede neural é comparável a análogos americanos avançados, como o Claude da Anthropic e o GPT-4 da OpenAI.
A rede neural Qwen3-235B-A22B-Instruct-2507-FP8 é uma atualização da versão anterior Qwen3-235B-A22B-FP8, mas opera em modo sem raciocínio — fornece resultados sem deduções lógicas passo a passo. Graças a isso, o comprimento máximo do conteúdo processado aumentou em oito vezes — para 256 000 tokens, permitindo trabalhar com textos muito maiores dentro de um único diálogo.
Recordamos que, em maio, a Alibaba anunciou uma quebra na redução do custo de treinamento de modelos de IA voltados para a busca.