A Anthropic anunciou o lançamento do Claude Opus 4.6, seu modelo de inteligência artificial mais recente, focado em programação, tarefas profissionais de longa duração e análise de conhecimento. O modelo representa uma atualização do Claude Opus 4.5, lançado pouco mais de dois meses antes, com melhorias em planejamento de código, revisão, depuração e operação em grandes bases de código. Ele mantém o contexto de até 1 milhão de tokens em beta, permitindo o processamento de conjuntos extensos de documentos e codebases completas.
Melhorias em Programação e Tarefas Agentic
O Claude Opus 4.6 aprimora as habilidades de programação do antecessor ao lidar com fluxos de trabalho inteiros, desde arquitetura até implantação, em horas. Na Rakuten, o modelo fechou e atribuiu problemas de forma autônoma em uma organização de 50 pessoas, gerenciando seis repositórios e decisões organizacionais. Na Harvey, ele alcançou 90,2% no BigLaw Bench, a pontuação mais alta entre os modelos Claude para tarefas jurídicas.
Além disso, o modelo se destaca em extração de informações de grandes documentos, pesquisas e análises financeiras. Testes mostram que ele gerencia migração de codebases multimilionárias como um engenheiro sênior, adaptando estratégias e concluindo em metade do tempo. No Claude Code, equipes de agentes podem trabalhar em paralelo, coordenando metas compartilhadas para reduzir gargalos em tarefas complexas.
🚨 Vagas abertas para o nosso grupo de ofertas que vai te fazer economizar MUITO!
Desempenho em Benchmarks e Comparações
O Claude Opus 4.6 ocupa o primeiro lugar no Terminal-Bench 2.0, com 65,4% em codificação agentic no terminal, e lidera no Humanity’s Last Exam, um teste de raciocínio multidisciplinar, com 53,1% usando ferramentas. No Finance Agent, ele atinge 60,7% em análise financeira agentic, e no GDPval-AA, registra 1.606 Elo para tarefas de escritório economicamente valiosas. Comparado ao Claude Sonnet 4.5, ele melhora 23 pontos percentuais na avaliação interna de finanças reais e pontua 76% no MRCR v2 para recuperação de contexto longo, contra 18,5% do antecessor.
Em experimentos controlados, como a construção de um blog com posts, autores e categorias via prompt único, o Opus 4.6 produz resultados com arquitetura mais refinada, identidade de marca coesa como “Inkwell” e design editorial polido, incluindo seção de artigos em destaque e navegação por categorias na homepage. O blog construído com Opus 4.6 demonstra hierarquia visual rica e conteúdo curado, como “Hidden Gems of the Portuguese Coast”, superando o blog construído com Opus 4.5 em sofisticação criativa e consistência holística.
Novos Recursos e Controles de API
O modelo introduz “pensamento adaptativo”, que usa pistas contextuais para decidir o nível de raciocínio estendido, com opções de esforço de baixo a máximo, reduzindo latência em tarefas simples. Conversas longas ativam compactação de contexto em beta, resumindo tokens antigos sob limiares configuráveis para manter o espaço na janela de 1 milhão de tokens. Ele suporta saídas de até 128 mil tokens e integrações como equipes de agentes no Claude Code para coordenação autônoma.
Atualizações no Claude para Excel incluem edição de tabelas dinâmicas, modificações de gráficos e formatação financeira, enquanto uma prévia de pesquisa lança suporte nativo no PowerPoint para criação de apresentações. Em uma demonstração, o modelo ingere planilhas empresariais para gerar análises de concorrentes, produzindo novas planilhas e decks de PowerPoint com informações pertinentes.
Depoimentos de Empresas e Aplicações Empresariais
Gregor Stewart, chief AI officer da SentinelOne, relatou que o Claude Opus 4.6 lidou com migração de codebase multimilionária como um engenheiro sênior, planejando antecipadamente e adaptando estratégias. Joel Hron, CTO da Thomson Reuters, destacou o salto em desempenho de contexto longo para fluxos de pesquisa complexos em documentos jurídicos, fortalecendo sistemas confiáveis. Yashodha Bhavnani, head of AI da Box, observou um aumento de 10% em avaliações, atingindo 68% em análise multi-fonte para conteúdo jurídico, financeiro e técnico.
Yusuke Kaji, general manager de AI da Rakuten, mencionou que o modelo fechou 13 issues e atribuiu 12 em um dia, sintetizando contexto entre domínios e escalando para humanos quando necessário. Outros feedbacks incluem elogios da Sourcegraph por planejamento agentic preciso e da JetBrains por raciocínio em casos extremos. Na Cognition, ele gerenciou decisões em uma organização de 50 pessoas; na Lovable, elevou a qualidade de design em sistemas autônomos.
Preço, Disponibilidade e Segurança
O Claude Opus 4.6 está disponível no chatbot da Anthropic, em plataformas de nuvem principais e via API, sem alterações no preço em relação ao Opus 4.5: US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de saída, com premium para prompts acima de 200 mil tokens. Novos controles de segurança identificam abusos em recursos cibernéticos, após a detecção de mais de 500 falhas em bibliotecas de código aberto. Avaliações abrangentes mostram baixas taxas de comportamentos desalinhados, como engano ou recusa excessiva, com testes para bem-estar do usuário e recusa de pedidos perigosos.
Além disso, o modelo impulsiona inovações empresariais, com 80% do negócio da Anthropic vindo de clientes corporativos. Ferramentas como Claude Code e Claude Cowork automatizam trabalho jurídico e engenharia de software, contribuindo para quedas em ações de fundos como WisdomTree Cloud Computing, abaixo de 20% no ano. Scott White, head of product for enterprise, descreveu a transição para “vibe working”, onde usuários delegam tarefas significativas ao modelo.





































