OpenAI, farklı yapay zeka modellerinin akıllı sözleşmelerde bulunan güvenlik açıklarını ne kadar iyi tespit ettiğini, yamaladığını ve hatta istismar ettiğini değerlendiren yeni bir kıyaslama ölçütü başlattı.
OpenAI, çarşamba günü yatırım şirketi Paradigm ve güvenlik firması OtterSec ile iş birliği içinde, yapay zeka ajanlarının 120 akıllı sözleşme zafiyetinden teorik olarak ne kadar istismar edebileceğini değerlendirmek için “EVMbench: Evaluating AI Agents on Smart Contract Security” başlıklı makaleyi yayımladı.
Anthropic’in Claude Opus 4.6 modeli ortalama 37.824 dolarlık “detect award” ile ilk sırada yer aldı. Bunu sırasıyla 31.623 dolar ve 25.112 dolar ile OpenAI’nin OC-GPT-5.2 modeli ve Google’ın Gemini 3 Pro modeli izledi.

Yapay zeka ajanları temel görevleri yerine getirmede giderek daha verimli hale gelirken, OpenAI performanslarının “ekonomik açıdan anlamlı ortamlarda” değerlendirilmesinin daha önemli hale geldiğini söyledi.
“Akıllı sözleşmeler milyarlarca dolarlık varlığı güvence altına alıyor ve yapay zeka ajanlarının hem saldırganlar hem de savunucular için dönüştürücü olması muhtemel.”
OpenAI, “Ajan temelli stablecoin ödemelerinin büyümesini bekliyoruz ve bunu pratik önemi artan bir alana dayandırmaya yardımcı oluyoruz” diye ekledi.
Circle CEO’su Jeremy Allaire 22 Ocak’ta, beş yıl içinde milyarlarca yapay zeka ajanının kullanıcılar adına günlük ödemeler için stablecoin'ler ile işlem yapacağını öngördü. Eski Binance patronu Changpeng “CZ” Zhao da yakın zamanda kriptonun yapay zeka ajanları için “yerel para birimi” haline geleceğini tahmin etti.
Ajan temelli yapay zekanın güvenlik açıklarını tespit etme performansını test etme ihtiyacı, saldırganların 2025 yılında 3,4 milyar dolar değerinde kripto fon çalmasının ardından ortaya çıkıyor ve bu rakam 2024’e kıyasla marjinal bir artış gösterdi.
EVMbench, 40 akıllı sözleşme denetiminden derlenen 120 seçilmiş zafiyete dayandı ve bunların çoğu açık kaynak denetim yarışmalarından elde edildi. OpenAI, bu kıyaslama ölçütünün yapay zekanın akıllı sözleşme zafiyetlerini geniş ölçekte tespit etme ve azaltma konusundaki ilerlemesini izlemeye yardımcı olmasını umduğunu söyledi.
“Akıllı sözleşmeler insanlar için inşa edilmedi”
Dragonfly’ın yönetici ortağı Haseeb Qureshi çarşamba günü X’te yaptığı bir paylaşımda, kriptonun mülkiyet haklarını ve yasal sözleşmeleri değiştirme vaadinin gerçekleşmediğini, bunun nedeninin teknolojinin başarısız olması değil insan sezgisine göre tasarlanmamış olması olduğunu söyledi.
Qureshi, özellikle boşaltıcı cüzdanlar ve diğer tehditler her zaman mevcutken büyük işlemleri imzalamanın hala “korkutucu” hissettirdiğini, oysa banka transferlerinin nadiren aynı korkuyu tetiklediğini söyledi.
Bunun yerine Qureshi, kripto işlemlerinin geleceğinin tehditlerle ilgilenecek ve kullanıcılar adına karmaşık operasyonları yönetecek yapay zeka aracılı, kendi kendine çalışan cüzdanlar tarafından kolaylaştırılacağına inanıyor:
“Bir teknoloji genellikle tamamlayıcısı sonunda ortaya çıktığında yerine oturur. GPS akıllı telefonu beklemek zorundaydı, TCP/IP tarayıcıyı beklemek zorundaydı. Kripto için bunu yapay zeka ajanlarında bulmuş olabiliriz.”

