Elon Musk predstavil Grok 3: Je to res “najpametnejša umetna inteligenca na svetu”?

Home » Elon Musk predstavil Grok 3: Je to res “najpametnejša umetna inteligenca na svetu”?

Muskovo podjetje xAI je predstavilo Grok 3, ki predstavlja konkurenco OpenAI-jevim ChatGPT in kitajskim DeepSeek. Musk je Grok 3 opisal kot “najinteligentnejšo umetno inteligenco na planetu.” Pa je to res?

Podjetje Elona Muska za umetno inteligenco, xAI, je v ponedeljek zvečer predstavilo svoj najnovejši paradni model umetne inteligence, Grok 3, skupaj z izboljšanimi funkcijami za svoje iOS in spletne aplikacije.

Grok je xAI-jev odgovor na OpenAI-jev GPT-4o, Googlov Gemini ter kitajski DeepSeek. Model zdaj lahko analizira slike, odgovarja na kompleksna vprašanja in še naprej poganja različne funkcije na Muskovi družbeni platformi X (bivši Twitter). Čeprav je bil prvotno načrtovan za izdajo v letu 2024, je Grok 3 doživel zamude, a je po mesecih razvoja končno ugledal luč sveta.

Preberi še: Prihaja GPT-5. Katere novosti prinaša?

Grok 3 naj bi bil občutno boljši od predhodnika

grok 3
Foto: Adobe Stock

Ta izdaja predstavlja pomemben mejnik za xAI. Podjetje je za treniranje modela izkoristilo ogromen podatkovni center v Memphisu, ki vsebuje približno 200.000 grafičnih procesorjev (GPU). V objavi na X je Musk trdil, da je bil Grok 3 razvit z desetkrat večjo računalniško močjo kot njegov predhodnik, Grok 2, ter usposobljen na bistveno razširjenem naboru podatkov, ki naj bi vključeval tudi sodne spise.

Med ponedeljkovo predstavitvijo v živo je Elon Musk opisal Grok 3 kot »novo ligo« od njegovega predhodnika, pri čemer je poudaril njegovo vlogo kot »maksimalno resnicoljubne umetne inteligence« – to je bilo za pričakovati, saj je Musk dokaj obseden s svobodo govora in politično korektnostjo.

Grok 3 ni le en sam model, temveč družina modelov umetne inteligence – podobno kot je za svoj naslednji model GPT 5 napovedal OpenAI. Ena od različic, Grok 3 mini, daje prednost hitrejšim odzivom na račun določene natančnosti. Čeprav še niso vse funkcije in modeli iz serije Grok 3 v celoti na voljo – nekateri so še v fazi beta testiranja – so se začeli uvajati že v ponedeljek.

Po navedbah xAI Grok 3 na več ključnih testih prekaša OpenAI-jev GPT-4o, vključno z:

  • AIME (testiranje zmogljivosti umetne inteligence pri matematičnih problemih)
  • GPQA (preizkus znanja na doktorski ravni iz fizike, biologije in kemije)

Poleg tega se je zgodnja različica Grok 3 uspešno kosala v Chatbot Areni, crowdsourcing platformi za primerjavo odgovorov umetne inteligence, kjer uporabniki glasujejo za najboljše odgovore.

Dva ključna modela znotraj družine Grok 3, Grok 3 Reasoning in Grok 3 mini Reasoning, sta optimizirana za izboljšano logično sklepanje. Ta modela posnemata umetno inteligenco, zasnovano na sklepanju, kot sta OpenAI-jev o3-mini in kitajski DeepSeek R1, saj pred generiranjem odgovorov poskušata preveriti lastna dejstva – kar zmanjšuje pogoste napake umetne inteligence.

xAI trdi, da Grok 3 Reasoning presega OpenAI-jev najboljši model o3-mini-high na več testih, vključno z novim matematičnim testom AIME 2025, s čimer dodatno utrjuje svoj položaj kot resen konkurent v svetu umetne inteligence.

Grok 3 je primeren za kompleksna vprašanja s področja matematike, znanosti in programiranja

Uporabniki lahko do Grok 3-jevih modelov sklepanja dostopajo prek aplikacije Grok, kjer imajo na voljo dve ključni možnosti:

  • “Think” način za standardne naloge sklepanja
  • “Big Brain” način za kompleksna vprašanja, ki zahtevajo dodatno računalniško moč

Po navedbah xAI ti modeli izstopajo pri matematičnih, znanstvenih in programerskih poizvedbah.

Musk je razkril, da so nekateri notranji procesi modelov sklepanja v aplikaciji Grok namenoma zakriti, da bi preprečili distilacijo—tehniko, ki jo razvijalci umetne inteligence uporabljajo za pridobivanje znanja iz drugih modelov. To potezo je xAI sprejel v luči obtožb, da je DeepSeek distiliral OpenAI-jeve modele za usposabljanje lastne umetne inteligence.

Grokovi modeli sklepanja poganjajo tudi novo funkcijo v aplikaciji Grok, imenovano DeepSearch, ki je xAI-jev odgovor na raziskovalna orodja, kot je OpenAI-jev deep research. DeepSearch preiskuje tako internet kot platformo X, analizira informacije in uporabnikom podaja povzetke ključnih vpogledov glede na njihova vprašanja.

Kaj pravijo tisti, ki so imeli prvi dostop do modela?

Andrej Karpathy, ustanovitelj Eureka Labs in nekdanji raziskovalec pri OpenAI/Tesli, je preizkusil Grok 3 in pohvalil njegove sposobnosti sklepanja, saj je uspešno opravil zapletene naloge, kot je ustvarjanje heksagonalne mreže za Settlers of Catan—nekaj, s čimer se mnogi modeli umetne inteligence ne morejo spopasti. Čeprav je nalogo uspešno izvedel tudi OpenAI-jev o1-pro (200 $/mesec), pa DeepSeek-R1, Gemini 2.0 Flash Thinking in Claude niso bili kos izzivu.

Karpathy je prav tako ugotovil, da je način sklepanja v Grok 3 prekašal OpenAI-jev o1 Pro pri ocenjevanju FLOP-ov, potrebnih za treniranje GPT-2. Vendar pa je imel DeepSearch določene težave, vključno z izmišljenimi URL-ji in manjkajočimi citati.

Kljub tem pomanjkljivostim je Karpathy sklenil, da Grok 3 + reasoning dosega skoraj vrhunski nivo umetne inteligence, saj je nekoliko pred DeepSeek-R1 in Gemini 2.0 Flash Thinking.

Tudi slavni podcaster Lex Fridman ga je preizkusil in bil nad modelom navdušen.

Bo Grok v prihodnosti odprtokoden model?

Musk je napovedal, da bo aplikacija Grok kmalu podpirala glasovni način, kar bo omogočilo modelom Grok sintetizirano govorjeno besedilo—možno že v enem tednu. Nekaj tednov kasneje bosta Grok 3 in DeepSearch dostopna tudi prek xAI-jevega poslovnega API-ja.

Poleg tega xAI načrtuje odprtokodno izdajo Grok 2 v prihodnjih mesecih. Musk je pojasnil, da je njihov pristop odprtokodna objava prejšnje različice, ko je najnovejši model popolnoma uveden.

Ko bo Grok 3 zrel in stabilen, kar bo verjetno v nekaj mesecih, bomo odprli izvorno kodo Grok 2,” je dejal Musk.

Koliko stane Grok 3?

Naročniki na X-ov Premium+ paket (50 dolarjev na mesec) bodo prvi dobili dostop do Grok 3. Vendar bodo nekatere napredne funkcije zaklenjene za nov naročniški načrt, imenovan SuperGrok. Po neuradnih informacijah naj bi SuperGrok stal 30 dolarjev na mesec ali 300 dolarjev na leto in vključeval:

  • Izboljšane sposobnosti sklepanja
  • DeepSearch poizvedbe za poglobljeno raziskovanje s pomočjo umetne inteligence
  • Neomejeno generiranje slik