
Anthropic, startup s podporo Amazona, je predstavil novo zbirko modelov umetne inteligence, Claude 4. Po navedbah podjetja ti modeli sodijo med najbolj zmogljive v industriji.
Do zdaj smo že navajeni, da se praktičnovsak teden bije nova bitka za prevlado med klepetalnimi roboti. Zdaj je Anthropic (ki ga podpira Amazon) predstavil svojo najnaprednejšo zbirko modelov umetne inteligence doslej, imenovano Claude 4. Po navedbah podjetja izstopata predvsem modela Claude Opus 4 in Claude Sonnet 4, ki naj bi postavljala »nov standard« na področju zmogljivosti AI agentov.
Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.
— Anthropic (@AnthropicAI) May 22, 2025
Claude Opus 4 is our most powerful model yet, and the world’s best coding model.
Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9
Ti agenti so sposobni obdelovati informacije iz tisočev virov, opravljati dolgotrajne naloge, ustvarjati vsebine, ki zelo spominjajo na človeško pisanje, in izvajati kompleksne operacije. Anthropic poudarja, da lahko ti agenti delujejo neprekinjeno do 7 ur. V času vse bolj zaostrene konkurence med tehnološkimi velikani bi takšni napredki lahko še dodatno približali umetno inteligenco avtomatizaciji dela v številnih panogah.
Preberi še: Kaj so AI agenti in v čem se razlikujejo od GPT-jev, kot je ChatGPT?
Kaj vse zmorejo novi AI modeli?
Po navedbah Anthropica je naprednejši izmed dveh novo predstavljenih modelov, Opus 4, sposoben vzdrževati osredotočeno delo skozi kompleksne delovne tokove. Drugi model, Sonnet 4, je zasnovan kot neposredna zamenjava za Sonnet 3.7 in prinaša opazne izboljšave na področjih, kot so programiranje, matematika in natančnost pri sledenju navodilom.
Both Claude 4 models are state-of-the-art on SWE-bench Verified, which measures how models solve real software issues.
— Anthropic (@AnthropicAI) May 22, 2025
As the best coding model, Claude Opus 4 can work continuously for hours on complex, long-running tasks—significantly expanding what AI agents can do. pic.twitter.com/04jL073GJy
Serija Claude 4 po podatkih podjetja tudi kaže zmanjšano težnjo po t. i. »reward hackingu« — vedenju, pri katerem AI sistemi izkoriščajo vrzeli v nalogah za dosego cilja, kar je bilo bolj izrazito pri Sonnet 3.7.
Čeprav te nadgradnje predstavljajo pomemben napredek, novi modeli ne vodijo pri vseh merilih. Model Opus 4 sicer premaga Gemini 2.5 Pro (Google), OpenAI o3 in GPT-4.1 na testu SWE-bench Verified, ki ocenjuje programerske sposobnosti. Vendar pa zaostaja za modelom o3 pri multimodalnih preizkusih, kot sta MMMU in GPQA Diamond, ki vključujeta zahtevna vprašanja s področij biologije, kemije in fizike.
Anthropic uvaja Opus 4 z dodatnimi varnostnimi ukrepi, med drugim izboljšanimi filtri za škodljive vsebine in okrepljenimi kibernetskimi protokoli. Interna ocena kaže, da bi ta model lahko občutno povečal sposobnost uporabnikov z znanstvenim znanjem za razvoj ali uporabo orožij za množično uničevanje, zaradi česar je uvrščen v podjetjev varnostni razred ASL-3.
Preberi še: Kaj je vibe kodiranje in kako ustvariti aplikacijo brez programerskega znanja v 2025?
Opus 4 in Sonnet 4 sta hibridna modela
Anthropic je predstavil dva napredna modela umetne inteligence, Opus 4 in Sonnet 4, ki ju opisuje kot “hibridna sistema”, sposobna hitrega odzivanja in poglobljenega razmišljanja prek posebnega načina delovanja. Ko je način razmišljanja aktiviran, modeli porabijo več časa za analizo težave in uporabniku predstavijo razumljiv povzetek svojega miselnega procesa — vendar ne v celoti, saj želi Anthropic zaščititi svoje lastniške metode.
Modela lahko sočasno uporabljata več orodij, kot so spletni iskalniki, in shranjujeta informacije v spomin, kar omogoča razvoj t. i. “tihega znanja” (tacit knowledge) za bolj dosledno delovanje. Namenjena sta dolgoročnemu izboljševanju in lahko samodejno preklapljata med razmišljanjem in uporabo orodij za višjo kakovost odgovorov.
Za podporo razvijalcem je Anthropic nadgradil tudi Claude Code, ki se zdaj integrira z razvojnimi okolji (IDE) in vključuje nov SDK. Ta omogoča, da Claude Code deluje kot podproces v podprtih sistemih, kar razvijalcem omogoča ustvarjanje asistentov za programiranje, ki jih poganja umetna inteligenca.
Te izboljšave poudarjajo prizadevanja podjetja Anthropic za razvoj pametnejših, uporabnejših in hkrati varnih AI agentov, ki so prilagojeni dejanskim potrebam uporabnikov in razvijalcev.
Preberi še: Kaj je ChatGPT in 10 najboljših primerov uporabe v 2025
Kaj pa cena?
Anthropic bo model Sonnet 4 ponudil tako brezplačnim kot plačljivim uporabnikom svojih klepetalnih aplikacij, medtem ko bo Opus 4 na voljo izključno naročnikom.
Za dostop do API-ja prek platform Amazon Bedrock in Google Vertex AI znaša:
- Cena za Opus 4 15 $ na milijon vhodnih žetonov in 75 $ za izhodne žetone.
- Cena za Sonnet 4 je ugodnejša: 3 $ za vhod in 15 $ za izhod na milijon žetonov.
Žetoni predstavljajo drobce podatkov, ki jih model obdeluje — milijon žetonov približno ustreza 750.000 besedam, kar je približno 163.000 besed več kot ima roman Vojna in mir.