Anthropic lança Claude Opus 4.8 com foco em codificação e fluxos de trabalho agentic
A Anthropic anunciou nesta quinta-feira o lançamento do Claude Opus 4.8, atualização do modelo anterior Opus 4.7 que promete melhorias significativas nas áreas de codificação, trabalho agentic, raciocínio e trabalho com conhecimento. A plataforma pode ser acessada pelo site claude.ai, pelo Claude Code e pela API da Anthropic, onde recebe a identificação claude-opus-4-8.
A empresa realizou diversas alterações nos detalhes de sua linha de produtos. Os usuários do claude.ai e do Cowork agora podem ajustar o nível de esforço que o Claude aplica a cada resposta, o que afeta essencialmente a quantidade de tokens que o modelo consome durante o processamento. Tokens são unidades de texto que os modelos de linguagem processam, semelhantes a fragmentos de palavras, e controlar seu uso permite equilibrar qualidade, velocidade e custos.
O Claude Code ganhou os chamados fluxos de trabalho dinâmicos, funcionalidade que planeja atividades, executa subagentes em paralelo, verifica os resultados e retorna informações ao usuário. Essa característica foi desenvolvida especialmente para bases de código extensas, podendo migrar códigos com centenas de milhares de linhas. A API de Mensagens agora aceita alterações em tempo real no array de mensagens, permitindo que desenvolvedores atualizem instruções durante uma tarefa sem comprometer o uso do cache de prompts ou necessitar de uma interação adicional do usuário.
Em relação aos custos, a Anthropic manteve o preço do Opus 4.8 fora do modo rápido em 5 dólares por milhão de tokens de entrada e 25 dólares por milhão de tokens de saída. No modo rápido, que opera com velocidade 2,5 vezes superior, o valor sobe para 10 dólares por milhão de tokens de entrada e 50 dólares por milhão de tokens de saída. O Opus 4.8 vem com esforço alto como configuração padrão, mas a empresa afirma que, em tarefas de codificação, esse nível mais elevado consome apenas a quantidade de tokens da versão anterior, mesmo assim oferecendo desempenho superior. Há também a opção xhigh para trabalhos que exigem maior capacidade computacional, e os limites de taxa do Claude Code foram aumentados para suportar o uso mais intenso de tokens.
A Anthropic posicionou o Opus 4.8 como um modelo projetado para codificação e fluxos de trabalho agentic, nos quais o sistema pode utilizar ferramentas dentro de um contexto e verificar seu próprio trabalho. A empresa informa que o novo modelo apresenta melhorias em relação ao Opus 4.7 em testes de referência para codificação, habilidades agentic, raciocínio e trabalho de escritório. O modelo também demonstrou menor probabilidade de aprovar código defeituoso sem alertá-lo, sendo quatro vezes menos provável de cometer esse erro. Além disso, apresentou taxas mais baixas de engano ou tendência a aceitar uso indevido em comparação com a versão anterior.
Diversas empresas testaram a plataforma antes de seu lançamento amplo, incluindo organizações dos setores de desenvolvimento de software, advocacia, finanças e pesquisa. Testadores comentaram sobre os fluxos de trabalho agentic, com um deles observando paridade de custo com o GPT-5.5 em testes internos de referência. Uma avaliação do CursorBench indicou que o Opus 4.8 utilizou menos etapas de ferramentas para alcançar o mesmo nível de resultado.
Os recursos adicionais do Opus 4.8 expõem aos usuários as trade-offs entre custos e esforço à medida que a empresa transita da cobrança por planos de assinatura para o faturamento baseado em tokens. Essas funcionalidades estão disponíveis atualmente em versão de pesquisa prévia nos planos Enterprise, Team e Max.
A Anthropic também utilizou o lançamento para indicar que desenvolve modelos que oferecem os níveis atuais de capacidade a custos menores para o usuário, além de prometer lançar uma classe de modelos superior à plataforma Opus atual. O roteiro da empresa inclui o Project Glasswing, sob o qual um grupo de organizações utiliza o Claude Mythos Preview para varredura de segurança cibernética. A empresa informou que modelos nesse nível de capacidade exigem salvaguardas mais robustas antes de serem disponibilizados a todos os clientes, e espera trazer modelos da classe Mythos aos clientes nas próximas semanas.