A OpenAI apresentou o GPT-5.2 como sua série de modelos mais capaz para trabalho profissional e agentes de longa duração. O lançamento chega ao ChatGPT nas variantes Instant, Thinking e Pro, começando por planos pagos, e fica disponível na API para desenvolvedores no mesmo dia.1
O posicionamento é menos sobre conversa genérica e mais sobre produção de artefatos: planilhas, apresentações, código, análises documentais, interpretação de imagens, uso de ferramentas e execução de projetos com várias etapas. A OpenAI afirma que o modelo foi desenhado para capturar mais valor econômico em atividades de conhecimento, especialmente quando combinado com supervisão humana.
Trabalho de conhecimento vira benchmark central
A empresa destaca resultados no GDPval, avaliação de tarefas bem especificadas de trabalho de conhecimento em 44 ocupações. Segundo a OpenAI, o GPT-5.2 Thinking vence ou empata com profissionais em 70,9% das comparações julgadas por especialistas humanos. A lista de tarefas inclui apresentações, planilhas, escalas, diagramas e outros artefatos usados em setores econômicos relevantes.1
Esse tipo de benchmark importa porque se aproxima mais do uso corporativo do que perguntas isoladas. Em empresas, o valor de IA aparece quando ela ajuda a preparar uma análise, revisar um modelo financeiro, organizar um cronograma, interpretar um dashboard ou transformar dados soltos em uma entrega compreensível. O risco também aumenta, porque erros em documentos bem formatados podem passar despercebidos.
Na programação, a OpenAI informa novos resultados em SWE-Bench Pro e SWE-bench Verified, além de melhorias em frontend, debugging, refatoração e tarefas de engenharia end-to-end. O lançamento também enfatiza visão, com redução de erros em raciocínio sobre gráficos e interfaces, e contexto longo, com desempenho forte em tarefas que exigem integrar informação espalhada por documentos extensos.
Agentes longos exigem governança mais madura
O GPT-5.2 também mira uso de ferramentas e fluxos agentivos. A OpenAI cita desempenho em Tau2-bench Telecom e descreve cenários de atendimento em que o modelo precisa coordenar rebooking, requisitos especiais, compensação e consultas a sistemas. Isso reforça a direção do mercado: modelos não querem apenas responder, querem operar processos.
Para empresas, a adoção precisa passar por controles. Um modelo mais capaz de usar ferramentas deve ter permissões mínimas, logs, validação de saída, ambientes de teste e pontos de aprovação. Quando o modelo cria planilhas ou apresentações, a revisão humana deve olhar números, fontes e premissas, não apenas aparência. Quando edita código, CI, testes e revisão continuam obrigatórios.
A OpenAI publicou também uma atualização do System Card para GPT-5.2, indicando que a abordagem de mitigação de segurança é em grande parte a mesma já descrita para GPT-5 e GPT-5.1, com referência às variantes GPT-5.2 Instant e GPT-5.2 Thinking.2 Esse documento é importante para compradores técnicos porque ajuda a mapear limitações, riscos residuais e controles de implantação.
O lançamento consolida a disputa por IA como ferramenta de trabalho profissional. A pergunta prática não é se o GPT-5.2 gera textos melhores. É se ele reduz o ciclo completo de uma entrega sem criar um passivo de verificação maior do que o ganho. Em tarefas de alto valor, o modelo precisa ser tratado como colaborador técnico: útil, rápido e cada vez mais capaz, mas ainda dependente de critérios, auditoria e responsabilidade humana.
- OpenAI, "Introducing GPT-5.2", 11 dez. 2025. ↩
- OpenAI, "Update to GPT-5 System Card: GPT-5.2", 11 dez. 2025. ↩