
Android 14 Abr
14 de abril de 2025 0
A OpenAI anunciou hoje o novo ChatGPT-4.1 com três variantes: o GPT-4.1, o 4.1 mini e o 4.1 nano, todos focados em codificação em acompanhamento de instruções para desenvolvedores que usam a API da OpenAI em seus projetos.
Segundo a empresa, os novos modelos têm suporte para um milhão de tokens, ou seja, instruções com cerca de até 750 mil palavras de uma só vez.
Em comparação com o ChatGPT-4o, que será descontinuado no final de abril, o ChatGPT-4.1 é superior em tarefas de codificação, vencendo o modelo anterior em vários benchmarks, como o SWE-bench, enquanto os modelos 4.1 mini e nano oferecem maior eficiência e rapidez para aparelhos móveis, mas com precisão reduzida.
Confira o comparativo de custo por milhão de tokens de cada modelo:
Testes internos indicam que o ChatGPT-4.1 consegue gerar 32.768 tokens enquanto o ChatGPT-4o gera apenas 16.384 no mesmo tempo. Além disso, o novo modelo superou todos os seus concorrentes ao conseguir entender vídeos com precisão de 72% no benchmark Video-MME na categoria "vídeo longo, sem legendas".
De acordo com Sarah Friar, CFO da OpenAI, a ideia é que modelos futuros da empresa possam programar aplicativos inteiros garantindo a qualidade deles com testes para solucionar problemas e até redação da documentação para publicação.
Otimizamos o GPT-4.1 para uso no mundo real com base no feedback direto para melhorar nas áreas com as quais os desenvolvedores mais se preocupam: codificação de front-end, fazer menos edições estranhas, seguir formatos de forma confiável, aderir à estrutura e ordenação de respostas, uso consistente de ferramentas e muito mais.
Com isto, os desenvolvedores poderão criar agentes que são melhores em tarefas de engenharia de software do mundo real, agilizando trabalhos que poderiam levar horas ou até dias para ser concluídos.
Por outro lado, o ChatGPT-4.1 ainda fica atrás do Gemini 2.5 Pro (63,8%) e Claude 3.7 Sonnet (62,3%) no SWE-bench Verified, uma versão validada por humanos do benchmark, resultando entre 52% e 54,6% de precisão. Segundo a OpenAI, esta diferença ocorreu porque alguns problemas do teste não podiam ser executadas em sua infraestrutura.
Por fim, o novo modelo de IA tem referência para eventos ocorridos até junho de 2024, o que lhe dá alguma vantagem em relação aos concorrentes.
Celular mais rápido! Ranking TudoCelular com gráficos de todos os testes de desempenho
Celular com a melhor bateria! Ranking TudoCelular com todos os testes de autonomia
Nada de Black Fraude! Ferramenta do TudoCelular desvenda ofertas falsas
Microsoft destaca novos recursos na build 26100.1876 do Windows 11 24H2
Comentários