Înapoi la știri

Anthropic lansează Claude Opus 4.7: Cum să-l încerci, benchmark-uri, siguranță

18 Apr 2026
5 minute min
Andrei Miroslavescu
Anthropic lansează Claude Opus 4.7: Cum să-l încerci, benchmark-uri, siguranță

În 2026, Anthropic a lansat produse și a generat știri într-un ritm alert, iar joi, compania de inteligență artificială a anunțat lansarea modelului Claude Opus 4.7. Acesta este cel mai inteligent model disponibil publicului general, deși Anthropic a menționat într-un comunicat de presă că Opus 4.7 nu este la fel de puternic ca Claude Mythos, considerat prea periculos pentru a fi lansat public. Potrivit mashable.com, Claude Opus este o familie de modele hibride de raționare capabile de raționare în mai multe etape și codare avansată.

👉 Modalități de acces și cost pentru Claude Opus 4.7

Claude Opus 4.7 este disponibil acum prin intermediul Claude AI, API-ul Claude și partenerii Anthropic, cum ar fi Microsoft Foundry. Prețul noului model este același cu cel al lui Claude Opus 4.6. Cu toate acestea, Anthropic a subliniat că, deoarece "Opus 4.7 gândește mai mult la niveluri de efort mai înalte", utilizează mai multe token-uri de output decât predecesorul său. Utilizatorii pot citi mai multe despre cum să optimizeze utilizarea token-urilor în ghidul de migrare pentru Opus 4.7.

👉 Îmbunătățiri și beneficii în performanță

Așa cum era de așteptat, Claude Opus 4.7 oferă capabilități îmbunătățite pe toate planurile. În special, Anthropic afirmă că Opus 4.7 este mai bun la sarcinile de codare avansată, inteligența vizuală și analiza documentelor. De asemenea, se spune că Opus 4.7 este "mai rafinat și creativ în completarea sarcinilor profesionale, producând interfețe, prezentări și documente de o calitate superioară".

"Utilizatorii raportează că pot delega cele mai dificile sarcini de codare — cele care necesitau anterior o supraveghere atentă — lui Opus 4.7 cu încredere. Opus 4.7 gestionează sarcini complexe și de lungă durată cu rigurozitate și consistență, acordând o atenție precisă instrucțiunilor și găsind modalități de a verifica propriile rezultate înainte de a le raporta înapoi", se menționează într-o postare pe blogul Anthropic.

👉 Comparații ale performanței și analiza riscurilor

Anthropic a publicat un card detaliat al modelului care oferă comparații între Claude Opus 4.7 și alte modele Anthropic, precum și cu modele de vârf de la OpenAI, Google și xAI. Opus 4.7 este în urma lui Claude Mythos, care a obținut scoruri semnificativ mai mari pe benchmark-urile comune, cum ar fi Humanity's Last Exam. "Claude Opus 4.7 este mai puțin capabil decât Claude Mythos Preview pe fiecare axă relevantă măsurată și nu avansează frontierele noastre de capacitate", se afirmă în cardul modelului.

Pe Humanity's Last Exam (fără unelte), Anthropic raportează că Opus 4.7 depășește toate celelalte modele de vârf, cu excepția lui Claude Mythos:

  • Claude Mythos a obținut 56.8% pe HLE
  • Claude Opus 4.7 a obținut 46.9%
  • Gemini 3.1 Pro a obținut 44.4%
  • GPT-5-4 Pro a obținut 42.7%
  • Claude Opus 4.6 a obținut 40.0%

Cu unelte, GPT-5-4-Pro a obținut 58.7% comparativ cu 54.7% pentru Opus 4.7. Mythos i-a depășit pe amândouă cu 64.7%. Mashable nu a verificat independent aceste rezultate de benchmark. Rezultatele complete sunt disponibile în cardul modelului Opus 4.7.

Anthropic raportează că Opus 4.7 arată un risc scăzut de comportamente nealiniate, având un profil de risc similar cu cel al lui Opus 4.6. De exemplu, Anthropic afirmă că Opus 4.7 este mai puțin probabil să halucineze și prezintă rate mai mici de hacking al recompenselor. "Claude Opus 4.7 este mai sincer decât Opus 4.6 sau Sonnet 4.6, cu reduceri mari în rata omisiunilor importante și îmbunătățiri moderate în factualitate și ratele de intrare halucinată", subliniază cardul modelului.

Alte postari din Economie
Economie

XAI își reorganizează echipa de inginerie înainte de IPO-ul SpaceX

Pe măsură ce xAI, compania de inteligență artificială a lui Elon Musk, se integrează tot mai mult cu SpaceX în perspectiva IPO-ului de succes al gigantului spațial, aceasta suferă o altă reorganizare majoră a echipei sale de inginerie, conform unui memo consultat de businessinsider.com. Michael Nicolls, executiv la SpaceX, a declarat că compania este „cu siguranță în urma” competiției și acționează pentru a recupera rapid decalajul.

Economie

Jeff Shell părăsește funcția de președinte al Paramount

Jeff Shell, președintele Paramount, va părăsi compania la mai puțin de un an de la preluarea funcției, în contextul unei fuziuni majore care se preconizează. Conform mai multor surse familiare cu situația, Shell va pleca de la companie în mod iminent.

Acasa Recente Radio Județe