Projeto Glasswing: Como a Anthropic Está Usando o Claude Mythos Preview para Encontrar Vulnerabilidades que Pesquisadores Levam Anos para Descobrir

A Anthropic revelou o Projeto Glasswing, uma iniciativa de cibersegurança com AWS, Apple, Google, Microsoft e outros parceiros para usar o Claude Mythos Preview na busca de falhas críticas em software. O modelo já identificou dezenas de milhares de vulnerabilidades, incluindo um bug de 27 anos no OpenBSD.
Glasswing

O Modelo que Encontra em Duas Semanas o que Pesquisadores Levam uma Vida para Descobrir

Há uma frase, dita por um pesquisador de segurança no vídeo de anúncio do Projeto Glasswing, que resume de forma mais direta do que qualquer análise técnica o que está acontecendo: “Encontrei mais bugs nas últimas duas semanas do que em todo o resto da minha vida combinado.”

A Anthropic revelou na última terça-feira o Projeto Glasswing, uma iniciativa de cibersegurança que usa o Claude Mythos Preview, seu modelo mais poderoso até agora e ainda não disponível ao público, em parceria com algumas das maiores empresas de tecnologia do mundo para encontrar e corrigir vulnerabilidades em software crítico antes que invasores possam explorá-las.

A escala do que foi descoberto até agora é impressionante. O modelo já identificou “dezenas de milhares” de vulnerabilidades de alto risco em todos os principais sistemas operacionais e navegadores web, incluindo um bug com 27 anos de existência no OpenBSD que podia derrubar qualquer servidor com apenas alguns pacotes de dados, e falhas no Linux que permitiam a usuários sem privilégios escalar para acesso de administrador. Todos os bugs foram reportados e corrigidos antes da divulgação pública.

A Coalizão Por Trás do Projeto

A iniciativa reúne Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, a Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks. O conjunto não é aleatório: são empresas que mantêm algumas das plataformas e bases de código mais amplamente implantadas no mundo. Falhas nos sistemas desses parceiros afetam bilhões de usuários e infraestruturas críticas em escala global.

Em vez de disponibilizar o Claude Mythos Preview publicamente, a Anthropic está restringindo o acesso a esses parceiros selecionados. A lógica, como Logan Graham, responsável pela equipe de desenvolvimento de fronteira da Anthropic, explicou ao Washington Examiner, é que este é um ponto de inflexão: “Nossa avaliação foi que este é o primeiro modelo bom o suficiente para nos levar a adotar uma abordagem de lançamento completamente diferente.”

Essa distinção entre o que é bom o suficiente para distribuição ampla e o que é poderoso demais para isso está no centro de toda a arquitetura do Projeto Glasswing.

Como o Modelo Opera: Efeito Colateral de Competência em Código

O detalhe técnico mais revelador sobre o Claude Mythos Preview no contexto de segurança é que suas capacidades ofensivas e defensivas não foram o objetivo de treinamento. Graham explicou que o modelo foi treinado para ser bom em código, e a competência em cibersegurança emergiu como consequência direta disso.

Essa distinção importa por duas razões. Primeiro, ela sugere que modelos futuros treinados explicitamente para segurança poderiam ser ainda mais capazes, o que projeta a trajetória tecnológica de forma preocupante. Segundo, ela indica que as capacidades de segurança do Claude Mythos Preview são generalizáveis, não limitadas a tipos específicos de vulnerabilidade ou linguagens de programação que foram incluídas no treinamento.

Na prática, o modelo consegue encadear múltiplas vulnerabilidades em sequências sofisticadas de exploração, reproduzindo o raciocínio que um pesquisador humano experiente realizaria ao longo de um dia inteiro de trabalho. Não é apenas encontrar falhas individuais: é simular o processo de um atacante que combina falhas menores para criar vetores de ataque de alto impacto.

O Bug de 27 Anos e o Que Ele Significa

A descoberta de uma vulnerabilidade com 27 anos de existência no OpenBSD merece atenção específica. O OpenBSD é conhecido por sua ênfase em segurança: é o sistema operacional que produziu o OpenSSH e é amplamente usado em infraestruturas críticas, servidores de rede e ambientes que exigem alto nível de segurança.

Uma falha que passou 27 anos sem ser detectada em um sistema dessa natureza, e que pode derrubar qualquer servidor afetado com apenas alguns pacotes de dados, demonstra que o problema não é falta de atenção humana. É a limitação da escala com que humanos conseguem revisar código. Pesquisadores de segurança são poucos, bases de código são enormes, e vulnerabilidades podem se esconder em interações entre sistemas que nenhum revisor individual consegue rastrear por completo.

O Claude Mythos Preview não tem essas limitações de atenção. Ele pode revisar bases de código completas, rastrear interações entre componentes e identificar condições de falha que surgem apenas em contextos específicos, exatamente o tipo de análise que excede a capacidade cognitiva humana em escala.

A Tensão Estrutural: O Mesmo Modelo que Protege Pode Atacar

A decisão de manter o acesso ao Claude Mythos Preview restrito a um conjunto selecionado de parceiros é, ao mesmo tempo, a parte mais sensata do Projeto Glasswing e a que levanta as questões mais difíceis.

A Anthropic tem feito briefings privados a autoridades do governo dos EUA sobre os riscos de cibersegurança representados por modelos desse nível. O New York Times noticiou que a tecnologia poderia permitir que hackers identificassem falhas de segurança muito mais rapidamente do que antes. E o contexto de ameaças reais reforça a urgência: o lançamento acontece em meio a tensões crescentes em torno de ataques cibernéticos habilitados por IA, incluindo um ataque recente vinculado ao Irã contra uma empresa americana de tecnologia médica que paralisou sistemas de saúde.

A tensão é estrutural e sem solução elegante: o mesmo modelo que encontra vulnerabilidades para corrigi-las pode encontrá-las para explorá-las. A Anthropic está apostando que a estratégia de distribuição controlada a parceiros com interesse claro em defesa, e não em ataque, é o equilíbrio possível. Mas esse equilíbrio depende de que o acesso permaneça efetivamente controlado, que outros atores não desenvolvam capacidades equivalentes independentemente, e que a velocidade de descoberta e correção supere a velocidade de exploração por atores maliciosos.

A Anthropic afirmou que está em discussões com agências federais sobre o uso da tecnologia para proteger infraestruturas críticas. Essa conversa com o setor público é, em última análise, onde muitas das decisões mais importantes sobre como esse tipo de modelo pode ser implantado de forma responsável precisarão ser tomadas, porque nenhuma empresa, por mais cuidadosa que seja, consegue sozinha definir os limites de uma tecnologia com esse grau de consequência dual.

Cadastre-se na nossa newsletter

Inscreva-se na newsletter para ver novas fotos, dicas e postagens no blog.​

Subscribe to My Newsletter

Subscribe to my weekly newsletter. I don’t send any spam email ever!