Anthropic lansează Claude Opus 4.7: Cum să-l încerci, benchmark-uri, siguranță
În 2026, Anthropic a lansat produse și a generat știri într-un ritm alert, iar joi, compania de inteligență artificială a anunțat lansarea modelului Claude Opus 4.7. Acesta este cel mai inteligent model disponibil publicului general, deși Anthropic a menționat într-un comunicat de presă că Opus 4.7 nu este la fel de puternic ca Claude Mythos, considerat prea periculos pentru a fi lansat public. Potrivit mashable.com, Claude Opus este o familie de modele hibride de raționare capabile de raționare în mai multe etape și codare avansată.
👉 Modalități de acces și cost pentru Claude Opus 4.7
Claude Opus 4.7 este disponibil acum prin intermediul Claude AI, API-ul Claude și partenerii Anthropic, cum ar fi Microsoft Foundry. Prețul noului model este același cu cel al lui Claude Opus 4.6. Cu toate acestea, Anthropic a subliniat că, deoarece "Opus 4.7 gândește mai mult la niveluri de efort mai înalte", utilizează mai multe token-uri de output decât predecesorul său. Utilizatorii pot citi mai multe despre cum să optimizeze utilizarea token-urilor în ghidul de migrare pentru Opus 4.7.
👉 Îmbunătățiri și beneficii în performanță
Așa cum era de așteptat, Claude Opus 4.7 oferă capabilități îmbunătățite pe toate planurile. În special, Anthropic afirmă că Opus 4.7 este mai bun la sarcinile de codare avansată, inteligența vizuală și analiza documentelor. De asemenea, se spune că Opus 4.7 este "mai rafinat și creativ în completarea sarcinilor profesionale, producând interfețe, prezentări și documente de o calitate superioară".
"Utilizatorii raportează că pot delega cele mai dificile sarcini de codare — cele care necesitau anterior o supraveghere atentă — lui Opus 4.7 cu încredere. Opus 4.7 gestionează sarcini complexe și de lungă durată cu rigurozitate și consistență, acordând o atenție precisă instrucțiunilor și găsind modalități de a verifica propriile rezultate înainte de a le raporta înapoi", se menționează într-o postare pe blogul Anthropic.
👉 Comparații ale performanței și analiza riscurilor
Anthropic a publicat un card detaliat al modelului care oferă comparații între Claude Opus 4.7 și alte modele Anthropic, precum și cu modele de vârf de la OpenAI, Google și xAI. Opus 4.7 este în urma lui Claude Mythos, care a obținut scoruri semnificativ mai mari pe benchmark-urile comune, cum ar fi Humanity's Last Exam. "Claude Opus 4.7 este mai puțin capabil decât Claude Mythos Preview pe fiecare axă relevantă măsurată și nu avansează frontierele noastre de capacitate", se afirmă în cardul modelului.
Pe Humanity's Last Exam (fără unelte), Anthropic raportează că Opus 4.7 depășește toate celelalte modele de vârf, cu excepția lui Claude Mythos:
- Claude Mythos a obținut 56.8% pe HLE
- Claude Opus 4.7 a obținut 46.9%
- Gemini 3.1 Pro a obținut 44.4%
- GPT-5-4 Pro a obținut 42.7%
- Claude Opus 4.6 a obținut 40.0%
Cu unelte, GPT-5-4-Pro a obținut 58.7% comparativ cu 54.7% pentru Opus 4.7. Mythos i-a depășit pe amândouă cu 64.7%. Mashable nu a verificat independent aceste rezultate de benchmark. Rezultatele complete sunt disponibile în cardul modelului Opus 4.7.
Anthropic raportează că Opus 4.7 arată un risc scăzut de comportamente nealiniate, având un profil de risc similar cu cel al lui Opus 4.6. De exemplu, Anthropic afirmă că Opus 4.7 este mai puțin probabil să halucineze și prezintă rate mai mici de hacking al recompenselor. "Claude Opus 4.7 este mai sincer decât Opus 4.6 sau Sonnet 4.6, cu reduceri mari în rata omisiunilor importante și îmbunătățiri moderate în factualitate și ratele de intrare halucinată", subliniază cardul modelului.