A Anthropic anunciou a aquisição da Vercept, startup sediada em Seattle especializada em automação de computador baseada em visão. Embora os valores do acordo não tenham sido divulgados, o movimento sinaliza claramente a intensificação da corrida para desenvolver agentes de IA capazes de operar softwares ativos da mesma forma que um humano.
A equipe de nove profissionais da Vercept — incluindo os cofundadores Kiana Ehsani, Luca Weihs e Ross Girshick — passa a integrar a Anthropic com foco direto na evolução das capacidades de uso de computador do Claude. O produto externo da startup, chamado Vy, será descontinuado até 25 de março.
A decisão revela uma estratégia objetiva: acelerar o desenvolvimento de IA capaz de navegar interfaces gráficas, interpretar telas, preencher formulários e manipular sistemas complexos sem depender exclusivamente de APIs estruturadas.
O que a Vercept traz para o Claude
Especialização em visão computacional aplicada à automação
A Vercept desenvolveu tecnologia baseada em visão computacional para interpretar telas e executar tarefas de desktop a partir de comandos em linguagem natural. Em vez de interagir apenas com dados estruturados, o sistema “enxerga” a interface como um usuário humano faria.
Essa abordagem resolve um dos principais gargalos dos agentes atuais: a capacidade de operar sistemas que não possuem integrações diretas via API.
Para a Anthropic, essa expertise é estratégica. Tornar o Claude capaz de operar planilhas, CRMs, ERPs, navegadores e ferramentas corporativas via interface gráfica amplia drasticamente seu escopo de aplicação empresarial.
Fundadores com forte base em pesquisa
A Vercept foi fundada por ex-integrantes do Allen Institute for AI (Ai2), um dos centros de pesquisa mais influentes em inteligência artificial nos Estados Unidos.
Entre os nomes de destaque está Ross Girshick, pioneiro em visão computacional e um dos pesquisadores mais citados na área, conhecido por trabalhos fundamentais como Faster R-CNN e Mask R-CNN. Ele também teve passagens pela Meta AI antes de retornar ao ecossistema de pesquisa em Seattle.
A presença de pesquisadores com esse nível de profundidade técnica reforça que a aquisição não é apenas estratégica, mas altamente especializada.
Claude Sonnet 4.6 e o avanço no benchmark OSWorld
A aquisição acontece logo após o lançamento do Claude Sonnet 4.6. Segundo a Anthropic, o modelo alcançou 72,5% no benchmark OSWorld — métrica utilizada para avaliar desempenho de IA em tarefas de uso de computador.
Para contextualizar, quando a empresa lançou inicialmente as capacidades de uso de computador no final de 2024, o desempenho estava abaixo de 15%. O salto é expressivo.
O Sonnet 4.6 já demonstra capacidade de:
- Navegar planilhas complexas
- Preencher formulários web em múltiplas abas
- Alternar entre janelas e fluxos de trabalho
- Executar sequências de ações com contexto persistente
Com a incorporação da equipe da Vercept, a tendência é que esse desempenho avance ainda mais em direção ao chamado “nível humano operacional”.
A corrida por agentes que usam computador como humanos
Estamos presenciando uma mudança estrutural na indústria de IA. O foco deixa de ser apenas geração de texto ou código e passa a ser execução prática de tarefas em ambientes reais.
A ideia de “uso de computador” envolve três pilares técnicos fundamentais:
Percepção
Capacidade de interpretar elementos visuais da interface — botões, menus, campos de formulário, gráficos e textos renderizados.
Raciocínio contextual
Entendimento da sequência de passos necessários para atingir um objetivo dentro de um software complexo.
Interação confiável
Execução precisa de cliques, digitação e navegação sem falhas críticas.
Resolver esses três problemas simultaneamente é um desafio técnico significativo. A Anthropic deixou claro que a expertise da Vercept se alinha diretamente com os “problemas mais difíceis” em que a empresa está trabalhando.
Acqui-hire como estratégia competitiva
A aquisição da Vercept segue um padrão estratégico conhecido como acqui-hire — quando uma empresa compra outra principalmente pelo talento técnico.
Essa é a segunda aquisição conhecida da Anthropic, após a compra da Bun, um motor de agente de codificação, em dezembro.
O padrão é claro: em vez de construir todas as competências internamente do zero, a empresa incorpora equipes altamente especializadas para acelerar ciclos de inovação.
Essa estratégia é comum em mercados de tecnologia de fronteira, onde o diferencial competitivo está diretamente ligado à qualidade da equipe de pesquisa.
Impacto para empresas e desenvolvedores
Se a Anthropic conseguir consolidar agentes com uso de computador confiável em larga escala, o impacto pode ser profundo.
Empresas poderão delegar tarefas como:
- Processamento de relatórios financeiros
- Atualização de sistemas internos
- Coleta e organização de dados
- Execução de rotinas administrativas repetitivas
Desenvolvedores, por sua vez, poderão integrar agentes que operam softwares legados sem necessidade de APIs customizadas.
Isso representa uma redução significativa de barreiras técnicas para automação.
Convergência de missão ou consolidação de mercado?
Kiana Ehsani descreveu a decisão como uma convergência de visão estratégica: unir forças para acelerar o desenvolvimento de agentes capazes de executar tarefas complexas de maneira confiável.
Por outro lado, a aquisição também reflete uma consolidação natural do mercado. Startups altamente especializadas estão sendo absorvidas por grandes laboratórios de IA para fortalecer suas plataformas principais.
Para investidores, o movimento reforça que a próxima grande fronteira da IA não é apenas gerar conteúdo, mas agir de forma autônoma em ambientes digitais reais.
Estamos próximos da IA operacional plena?
Ainda existem desafios técnicos relevantes:
- Robustez em ambientes dinâmicos
- Segurança contra ações indesejadas
- Confiabilidade em sistemas críticos
- Escalabilidade de execução em larga escala
No entanto, o avanço de menos de 15% para 72,5% no OSWorld em poucos meses indica evolução acelerada.
A aquisição da Vercept reforça uma tese central: a próxima fase da inteligência artificial será definida por agentes que executam, não apenas respondem.
Se essa trajetória continuar, o conceito de “assistente” dará lugar ao de “operador digital autônomo”. E nesse cenário, a Anthropic posiciona o Claude como um dos principais candidatos a liderar essa transformação.