- Defense
- Robotics
- Autonomy(coming soon)
- Mobility(coming soon)
- Space Tech(coming soon)
- Brain-Computer Interfaces
- Spatial Computing
- Voice & Conversational Interfaces
- Avatars & Digital Humans(coming soon)
- Smart Homes(coming soon)
- Wearables(coming soon)
- Health Tech
- Biotech / Synthetic Biology(coming soon)
- Longevity & Human Enhancement(coming soon)
- Data Infrastructure
- Payments & Financial Infrastructure
- Blockchain / Crypto(coming soon)
- Cloud & Edge Computing(coming soon)
- Cybersecurity(coming soon)
- Digital Identity(coming soon)
- Creative AI & Media
- Energy
- Manufacturing
- Agriculture Tech(coming soon)
- Climate Tech(coming soon)
- Commerce(coming soon)
- Education Tech(coming soon)
- Fashion & Textiles(coming soon)
- Food Tech(coming soon)
- Materials Science(coming soon)

- Defense
- Robotics
- Autonomy(coming soon)
- Mobility(coming soon)
- Space Tech(coming soon)
- Brain-Computer Interfaces
- Spatial Computing
- Voice & Conversational Interfaces
- Avatars & Digital Humans(coming soon)
- Smart Homes(coming soon)
- Wearables(coming soon)
- Health Tech
- Biotech / Synthetic Biology(coming soon)
- Longevity & Human Enhancement(coming soon)
- Data Infrastructure
- Payments & Financial Infrastructure
- Blockchain / Crypto(coming soon)
- Cloud & Edge Computing(coming soon)
- Cybersecurity(coming soon)
- Digital Identity(coming soon)
- Creative AI & Media
- Energy
- Manufacturing
- Agriculture Tech(coming soon)
- Climate Tech(coming soon)
- Commerce(coming soon)
- Education Tech(coming soon)
- Fashion & Textiles(coming soon)
- Food Tech(coming soon)
- Materials Science(coming soon)

- Defense
- Robotics
- Autonomy(coming soon)
- Mobility(coming soon)
- Space Tech(coming soon)
- Brain-Computer Interfaces
- Spatial Computing
- Voice & Conversational Interfaces
- Avatars & Digital Humans(coming soon)
- Smart Homes(coming soon)
- Wearables(coming soon)
- Health Tech
- Biotech / Synthetic Biology(coming soon)
- Longevity & Human Enhancement(coming soon)
- Data Infrastructure
- Payments & Financial Infrastructure
- Blockchain / Crypto(coming soon)
- Cloud & Edge Computing(coming soon)
- Cybersecurity(coming soon)
- Digital Identity(coming soon)
- Creative AI & Media
- Energy
- Manufacturing
- Agriculture Tech(coming soon)
- Climate Tech(coming soon)
- Commerce(coming soon)
- Education Tech(coming soon)
- Fashion & Textiles(coming soon)
- Food Tech(coming soon)
- Materials Science(coming soon)

DevTools & AI Coding benchmarks

How performance is measured at the frontier · as of 2026-06-15 · 4 benchmarks

% resolved

Share of real GitHub issues resolved end-to-end.

↑ higher is betterSWE-bench

% pass

Edit-format correctness across six programming languages.

↑ higher is betterAider leaderboard

Elo

Head-to-head: models write bots that compete in programming-game arenas.

↑ higher is betterCodeClash

$ / 1M tokens

Published price, 3:1 input:output blend — lower is cheaper.

↓ lower is betterLiteLLM (open pricing)