Qwen, o modelo de IA da Alibaba, se destaca com recordes em performance open source
Desempenho acima de rivais como Gemini 2.5 Pro (Google), o4‑mini (OpenAI) e DeepSeek‑R1, o novo modelo se destacou em benchmarks exigentes, como o AIME25 e o LiveCodeBench v6.
A corrida pelo domínio da inteligência artificial acaba de ganhar um novo capítulo, e desta vez com um protagonista vindo do oriente. A Alibaba Cloud, divisão de computação em nuvem da gigante chinesa Alibaba, lançou recentemente um modelo avançado de IA chamado Qwen3-235B-A22B, também conhecido como “Thinking‑2507”, que está se destacando internacionalmente por seu desempenho superior em tarefas que exigem raciocínio lógico, resolução de problemas e geração de código.
O que torna esse modelo particularmente notável é que, além de seu alto desempenho, ele é totalmente open source, estando disponível sob a licença Apache 2.0, o que permite uso comercial e modificação livre — um diferencial importante em comparação com os modelos proprietários da OpenAI (como GPT-4) e da Google DeepMind (como Gemini).
🚀 Superando os gigantes: benchmarks colocam o Qwen3 no topo
Diversos testes de benchmark vêm demonstrando que o Qwen3-235B-A22B é, até agora, o modelo de raciocínio mais poderoso de código aberto já disponibilizado publicamente. Em avaliações especializadas, ele superou até mesmo modelos de ponta como:
- Gemini 2.5 Pro (Google)
o4‑mini (OpenAI)
DeepSeek‑R1 (DeepSeek)
Entre os benchmarks utilizados, destacam-se:
-
AIME25: um teste focado em tarefas matemáticas e lógicas avançadas, onde o Qwen3 atingiu 92,3 pontos, ficando à frente de vários modelos comerciais;
-
LiveCodeBench v6: avalia a capacidade de escrever e executar código com precisão; o Qwen3 obteve 74,1, superando concorrentes como Gemini 2.5 Pro (72,5) e o4‑mini (71,8);
-
GPQA: voltado a perguntas de conhecimento avançado, onde obteve 81,1 pontos — quase empatando com o DeepSeek‑R1 (81,0) e se aproximando do topo da categoria;
-
Arena-Hard v2: que mede preferências humanas em respostas complexas, no qual o modelo da Alibaba também liderou com 79,7 pontos.
Esses resultados colocam o Qwen3 entre os modelos mais sofisticados já desenvolvidos — e isso sem depender de APIs fechadas ou infraestrutura proprietária.
🧠 Arquitetura inteligente: o segredo da eficiência
O Qwen3-235B-A22B faz parte da geração Qwen 3, lançada oficialmente em abril de 2025. Ele foi construído sobre a arquitetura conhecida como MoE (Mixture of Experts) — um sistema que permite ativar apenas parte da rede neural conforme a tarefa executada. No caso do Thinking‑2507, o modelo possui 235 bilhões de parâmetros no total, mas apenas 22 bilhões são ativados por solicitação, tornando-o extremamente eficiente em termos de custo computacional e consumo de energia.
Esse modelo também se diferencia por incluir um modo de raciocínio dedicado. Ao contrário das versões anteriores, que alternavam entre diferentes modos de operação, o Qwen3-235B-A22B foi projetado para trabalhar de forma especializada em tarefas que exigem pensamento estruturado, dedução lógica, planejamento e codificação.
🌐 Um marco para a IA de código aberto
Além da potência técnica, a grande notícia para desenvolvedores, pesquisadores e empresas é a disponibilização gratuita e aberta do modelo. A Alibaba liberou o Qwen3 sob a licença Apache 2.0, o que significa que qualquer pessoa — física ou jurídica — pode usar, adaptar, treinar e integrar esse modelo em suas próprias soluções, sem pagar royalties nem depender de plataformas externas.
Esse tipo de iniciativa fortalece a comunidade global de IA e democratiza o acesso a tecnologias de ponta. Em um cenário onde muitos dos melhores modelos estão trancados atrás de paywalls ou restrições comerciais, a postura da Alibaba representa um avanço significativo para o ecossistema open source.
📌 Conclusão: a IA que pensa — e é para todos
O Qwen3-235B-A22B “Thinking‑2507” representa uma virada no cenário da inteligência artificial. Com desempenho acima de gigantes como OpenAI e Google em tarefas complexas, arquitetura moderna baseada em especialistas, e uma política de código aberto, ele mostra que é possível combinar excelência técnica com acessibilidade.
Para o Brasil e demais países em desenvolvimento, esse tipo de iniciativa abre novas oportunidades para pesquisadores, startups, universidades e órgãos públicos que buscam soluções avançadas de IA sem os altos custos e limitações dos modelos comerciais.
O futuro da inteligência artificial está mais aberto — e mais inteligente — do que nunca.
🔗 Fonte: VentureBeat – It’s Qwen’s Summer

