OpenAI a dezvăluit un cadru de testare menit să măsoare cât de eficient pot agenții AI să detecteze, să atenueze și chiar să exploateze vulnerabilitățile de securitate în cryptoOpenAI a dezvăluit un cadru de testare menit să măsoare cât de eficient pot agenții AI să detecteze, să atenueze și chiar să exploateze vulnerabilitățile de securitate în crypto

OpenAI Pune Agenți AI Unii Împotriva Altora pentru a Testa Securitatea Contractelor Inteligente

2026/02/19 09:26
8 min de lectură
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

OpenAI a dezvăluit un cadru de testare de referință destinat măsurării eficienței cu care agenții AI pot detecta, atenua și chiar exploata vulnerabilitățile de securitate din contractele inteligente crypto. Proiectul, intitulat "EVMbench: Evaluarea agenților AI în securitatea contractelor inteligente", a fost lansat în colaborare cu Paradigm și OtterSec, două organizații cu o expunere profundă în domeniul securității blockchain și al investițiilor. Studiul evaluează agenții AI pe baza unui set curatat de 120 de slăbiciuni potențiale extrase din 40 de audituri de contracte inteligente, căutând să cuantifice nu doar capacitățile de detectare și corectare, ci și potențialul teoretic de exploatare al acestor agenți într-un mediu controlat.

Concluzii cheie

  • EVMbench testează agenții AI împotriva a 120 de vulnerabilități extrase din 40 de audituri de contracte inteligente, punând accent pe vulnerabilitățile provenite din competiții de audit open-source.
  • Printre modelele testate, Claude Opus 4.6 de la Anthropic a condus cu o recompensă medie de detectare de 37.824 USD, urmat de OC-GPT-5.2 de la OpenAI cu 31.623 USD și Gemini 3 Pro de la Google cu 25.112 USD.
  • OpenAI prezintă testul de referință ca un pas către măsurarea performanței AI în "medii semnificative din punct de vedere economic", nu doar în sarcini simple, evidențiind implicațiile din lumea reală pentru atacatori și apărători în peisajul securității crypto.
  • Cercetătorii notează că contractele inteligente securizează miliarde de dolari în active, subliniind valoarea strategică a instrumentelor activate de AI atât pentru activități ofensive, cât și defensive.
  • Observatorii din industrie au legat aceste dezvoltări de discuții mai ample despre plățile conduse de AI și rolul stablecoin-urilor în tranzacțiile cotidiene, cu directori importanți care prognozează o utilizare crescută a agenților în anii următori.
  • Contextul unei astfel de lucrări este subliniat de datele incidentelor de securitate crypto din 2025, care arată un flux continuu de fonduri prin vulnerabilități și atacuri, consolidând cererea pentru mecanisme robuste de audit și apărare activate de AI.

Recompensele de detectare pentru agenții AI sunt detaliate în PDF-ul OpenAI care însoțește studiul, care descrie și metodologia de evaluare și scenariile utilizate pentru a simula riscul contractelor inteligente din lumea reală. Autorii subliniază că, deși agenții AI au evoluat pentru a automatiza o gamă largă de sarcini de rutină, evaluarea performanței lor în "medii semnificative din punct de vedere economic" este esențială pentru înțelegerea modului în care vor performa sub presiune în sistemele de producție.

OpenAI menționează că se așteaptă ca tehnologiile agentice să lărgească domeniul plăților și decontărilor, inclusiv stablecoin-urile utilizate în fluxurile de lucru automatizate. Discuția în jurul plăților activate de AI se extinde dincolo de testarea securității la întrebarea mai largă despre modul în care sistemele autonome vor participa la activitatea financiară zilnică. Propriile proiecții ale companiei sugerează că plățile agentice ar putea deveni mai obișnuite, fundamentând capacitățile AI în cazuri practice de utilizare care afectează tranzacțiile cotidiene ale consumatorilor.

Împreună cu rezultatele testului de referință, CEO-ul Circle, Jeremy Allaire, a prognozat public că miliarde de agenți AI ar putea tranzacționa cu stablecoin-uri pentru plăți cotidiene în următorii cinci ani. Acea viziune se intersectează cu o temă recurentă în cercurile crypto: potențialul ca crypto să devină moneda nativă a agenților AI, o narațiune care a câștigat o atenție notabilă din partea liderilor din industrie și investitorilor deopotrivă. Deși astfel de predicții rămân speculative, tendința de bază este clară—automatizarea AI se deplasează de la laborator la nivelul tranzacțiilor, unde ar putea remodela modul în care valoarea se mișcă prin rețele.

Studiul apare într-un moment în care securitatea crypto continuă să fie un factor de risc semnificativ pentru investitori. Datele despre asaltul din 2025 asupra fondurilor crypto—unde atacatorii au sustras aproximativ 3,4 miliarde USD—evidențiază urgența unor instrumente îmbunătățite și mecanisme de corectare mai rapide și mai fiabile. Cadrul EVMbench este poziționat, în parte, ca o modalitate de a măsura dacă agenții AI pot contribui semnificativ la capacitățile defensive la scară, reducând oportunitățile de exploatare și accelerând atenuarea amenințărilor.

Pentru a construi testul de referință, cercetătorii s-au bazat pe 120 de vulnerabilități curatate care acoperă 40 de audituri de contracte inteligente, multe slăbiciuni fiind urmărite până la provocările de audit open-source. OpenAI susține că testul de referință va ajuta la urmărirea progresului AI în recunoașterea și atenuarea slăbiciunilor la nivelul contractelor la scară, oferind o modalitate standardizată de a compara viitoarele modele AI pe măsură ce evoluează. Studiul oferă, de asemenea, o perspectivă asupra modului în care AI ar putea fi aplicat pentru normalizarea evaluării riscurilor pe o gamă largă de arhitecturi de contracte inteligente, mai degrabă decât concentrându-se doar pe cazuri izolate.

Contractele inteligente nu au fost construite pentru oameni: Dragonfly

Într-un fir contemporan pe X, Haseeb Qureshi, partener la Dragonfly, a argumentat că promisiunea crypto de a înlocui drepturile de proprietate și contractele tradiționale nu s-a materializat niciodată nu pentru că tehnologia a eșuat, ci pentru că nu a fost niciodată proiectată având în vedere intuiția umană. El a evidențiat frica persistentă asociată cu semnarea tranzacțiilor mari într-un mediu în care portofelele de golire și alți vectori de atac rămân o amenințare constantă, în contrast puternic cu experiența comparativ mai lină a transferurilor bancare tradiționale.

Qureshi susține că următoarea fază a tranzacțiilor crypto ar putea fi activată de portofele auto-conduse, intermediere de AI. Astfel de portofele ar monitoriza riscul, ar gestiona operațiuni complexe și ar răspunde autonom la amenințări în numele utilizatorilor, reducând potențial fricțiunea și frica care caracterizează transferurile mari astăzi.

Concluzia mai largă din acest fir este că agenții AI pot juca un rol critic în transformarea modului în care oamenii interacționează cu crypto—trecând de la tranzacții manuale, predispuse la erori, la procese automatizate, conștiente de risc, care pot scala odată cu adoptarea. Pe măsură ce agenții AI încep să demonstreze mai multă competență în gestionarea preocupărilor de securitate, utilizatorii ar putea vedea o fiabilitate și reziliență îmbunătățită în fluxurile de lucru ale finanțelor descentralizate, chiar și pe măsură ce tehnologiile de bază continuă să se maturizeze.

Ce urmează să urmărim

  • Publicarea și replicarea independentă a setului complet de date EVMbench pe modele și arhitecturi AI suplimentare.
  • Adoptarea mai largă a fluxurilor de lucru de audit asistate de AI de către auditori, burse și proiecte DeFi care doresc să consolideze pozițiile de securitate.
  • Explorări în portofele agentice și fluxuri de plată autonome, inclusiv considerații de reglementare și conformitate pentru activele gestionate de AI.
  • Teste de referință ulterioare care compară mai multe sisteme AI pe măsură ce sunt lansate versiuni noi, urmărind îmbunătățiri în acuratețea detectării și viteza de corectare.

Surse și verificare

  • OpenAI: EVMbench: Evaluarea agenților AI în securitatea contractelor inteligente — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Prezentarea EVMbench — https://openai.com/index/introducing-evmbench/
  • Pierderi de securitate crypto în 2025 (acoperire de raportare): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi despre AI și UX crypto (postare X): https://x.com/hosseeb/status/2024136762424185208
  • Conducerea AI a Chinei și implicațiile crypto (analiză): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw și dezvoltările botului AI în acoperirea Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Cifre cheie și pași următori

Studiul EVMbench demonstrează că modelele lingvistice mari și agenții AI asociați încep să efectueze muncă de securitate semnificativă în spațiul contractelor inteligente, cu diferențe clar cuantificabile între modele. Conducerea lui Claude Opus 4.6 în recompensele medii de detectare semnalează că anumite arhitecturi pot fi mai abile în identificarea și atenuarea vulnerabilităților din logica contractuală complexă, în timp ce altele rămân în urmă, oferind un spectru de capacități pe care cercetătorii vor dori probabil să le rafineze. Includerea mai multor parteneriate din industrie în proiect subliniază consensul crescând că securitatea activată de AI și gestionarea automatizată a riscurilor ar putea deveni esențiale pentru scalare în medii descentralizate.

Pe măsură ce domeniul evoluează, observatorii vor urmări cât de repede pot tranziționa agenții AI de la detectare la remediere și dacă acești agenți pot opera în mod fiabil în sistemele live fără a introduce noi riscuri. Conversația despre portofelele conduse de AI și plățile autonome atinge un set mai larg de întrebări legate de guvernanța securității, consimțământul utilizatorilor și alinierea reglementărilor. Dacă traiectoria sugerată de OpenAI și partenerii săi continuă, instrumentele asistate de AI ar putea deveni o componentă de bază a infrastructurii crypto viitoare, schimbând atât calculul riscului, cât și experiența utilizatorului în moduri semnificative. Următoarea rundă de teste de referință, alături de implementările din lumea reală, va ajuta la determinarea cât de repede se materializează această viziune și ce măsuri de protecție trebuie să o însoțească.

Acest articol a fost publicat inițial ca OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts pe Crypto Breaking News – sursa ta de încredere pentru știri crypto, știri Bitcoin și actualizări blockchain.

Oportunitate de piață
Logo Smart Blockchain
Pret Smart Blockchain (SMART)
$0.004387
$0.004387$0.004387
-2.14%
USD
Smart Blockchain (SMART) graficul prețurilor în timp real
Declinarea responsabilității: Articolele publicate pe această platformă provin de pe platforme publice și sunt furnizate doar în scop informativ. Acestea nu reflectă în mod necesar punctele de vedere ale MEXC. Toate drepturile rămân la autorii originali. Dacă consideri că orice conținut încalcă drepturile terților, contactează [email protected] pentru eliminare. MEXC nu oferă nicio garanție cu privire la acuratețea, exhaustivitatea sau actualitatea conținutului și nu răspunde pentru nicio acțiune întreprinsă pe baza informațiilor furnizate. Conținutul nu constituie consiliere financiară, juridică sau profesională și nici nu trebuie considerat o recomandare sau o aprobare din partea MEXC.