Anthropic Detalha Arquitetura "Harness" para Agentes de Codificação de Longa Duração

A Anthropic publicou um artigo técnico profundo detalhando o design de harnesses - estruturas de execução - para agentes de IA que desenvolvem aplicações completas de forma autônoma em sessões que podem durar horas. O estudo aborda problemas críticos como a perda de coerência no contexto e a "ansiedade de contexto", onde o agente perde o foco ou esquece decisões anteriores em tarefas prolongadas. A solução proposta é uma arquitetura de três agentes especializados, inspirada em GANs, para gerenciar o ciclo de vida de projetos de software complexos.

Desafios de Longa Duração

Tarefas de codificação full-stack ou design de frontend subjetivo exigem que um agente mantenha um estado mental consistente por longos períodos. Modelos de linguagem atuais têm janelas de contexto finitas e tendem a "divagar" ou repetir ciclos. A ansiedade de contexto descreve o fenômeno onde o agente, ao lidar com muitas informações, começa a tomar decisões cada vez mais conservadoras ou aleatórias, comprometendo a qualidade do trabalho. Superar isso exige mais do que prompts engenhosos; requer uma arquitetura de sistema.

Arquitetura de Três Agentes

A proposta da Anthropic estrutura o processo em três papéis distintos. O planejador cria um plano de alto nível e divide a tarefa em subtarefas. O gerador executa a codificação ou design com base nesse plano. O avaliador revisa o trabalho do gerador, verifica a qualidade e fornece feedback estruturado. Esse loop de planejar-gerar-avaliar, com handoffs de estado bem definidos, permite que cada agente opere em sua zona de competência ideal, mantendo a coerência geral do projeto. A arquitetura é aplicada tanto para design subjetivo quanto para codificação com correção verificável. A divisão clara de responsabilidades, a transição de estado estruturada entre agentes e o loop de feedback para auto-correção são pilares fundamentais, com foco em tarefas de horas ou dias.

Handoffs e Coerência

Um aspecto fundamental é a definição precisa de como o estado é transferido entre os agentes. O planejador entrega um plano detalhado e critérios de sucesso. O gerador produz código ou design, e o avaliador verifica contra esses critérios. Essa estrutura evita que o agente perca o foco, pois cada um tem um escopo limitado e bem definido. A inspiração em GANs - onde um gerador e um discriminador se melhoram mutuamente - traz uma lógica de adversarial collaboration para o domínio da engenharia de software.

Implicações para a Engenharia de Agentes

Este trabalho representa um movimento além dos agentes de conversação ou de ação única. Estamos falando de sistemas multiagente projetados para projetos criativos e técnicos complexos. A inspiração em GANs estabelece um novo patamar para o que pode ser automatizado, indo além de snippets de código para arquiteturas completas. A indústria de desenvolvimento de software pode estar à beira de uma transformação onde agentes autônomos lidam com tarefas de escopo amplo. A arquitetura harness da Anthropic oferece um blueprint para construir tais sistemas de forma robusta. O sucesso desses harnesses determinará a velocidade com que agentes de IA deixarão de ser assistentes para se tornarem colegas de equipe autônomos em projetos de engenharia.

Anthropic Detalha Arquitetura "Harness" para Agentes de Codificação de Longa Duração

Desafios de Longa Duração

Arquitetura de Três Agentes

Handoffs e Coerência

Implicações para a Engenharia de Agentes

Relacionados

Prefeito de Nova York exige divulgação de imagens de IA em aluguéis

Psiquiatra alerta que efeitos da IA no cérebro ainda são incertos

Drone da USAF com IA dispara míssil AMRAAM real em teste histórico

Anthropic encara o muro da consciência em IA com aposta de risco

IA no cuidado de saúde comportamental, como a tecnologia complementa, mas não substitui o humano

Anthropic avança na integração de IA com ciência química, tornando Claude mais eficaz em análise de dados

Foto hands-on expõe Xiaomi Mix Fold 5 rodando HyperOS 4 no Android 17