Our evaluation of OpenAI's GPT-5.5 cyber capabilities

Simon Willison·Simon Willison·AI·April 30, 2026

Our evaluation of OpenAI's GPT-5.5 cyber capabilities The UK's AI Security Institute previously evaluated Claude Mythos: now they've evaluated GPT-5.5 for finding security vulnerability and found it to be comparable to Mythos, but unlike Mythos it's generally available right now. Tags: ai, openai, generative-ai, llms, anthropic, claude, ai-security-research, gpt

Read full article →

Our evaluation of OpenAI's GPT-5.5 cyber capabilities

Related Articles