Podjetje Elona Muska lansiralo chatbota Grok-2: Se lahko primerja s ChatGPT?

Home » Podjetje Elona Muska lansiralo chatbota Grok-2: Se lahko primerja s ChatGPT?

Muskovo pofjetje xAI je predstavilo Grok-2, najnovejši model umetne inteligence, zasnovan za uporabnike X, ki ima napredne zmožnosti klepeta, kodiranja in sklepanja. Pa se lahko kosa s ChatGPT?

Podjetje Elona Muska je v beta različici predstavilo klepetalna robota Grok-2 in Grok-2 mini, ki imata izboljšane zmožnosti sklepanja. Novi model umetne inteligence Grok zdaj uporabnikom omogoča ustvarjanje slik v družbenem omrežju X (bivši Twitter), čeprav je dostop do njega trenutno omejen na uporabnike platforme Premium in Premium+.

Po podatkih xAI sta tako Grok-2 kot Grok-2 mini uporabnikom X na voljo v beta različici. Izdaja pomeni pomemben napredek v primerjavi s prejšnjim modelom Grok-1.5 z izboljšanimi možnostmi klepeta, kodiranja in sklepanja. Grok-2 mini je predstavljen tudi kot manjša, vendar zmogljiva različica Grok-2. Zgodnja različica Grok-2 je bila preizkušena na lestvici LMSYS pod imenom »sus-column-r«, kot je navedeno v objavi na blogu xAI. Muskovo podjetje za umetno inteligenco namerava te modele še ta mesec dati na voljo tudi razvijalcem prek svojega API za podjetja.

Na preizkusu je Grok-2 celo prehitel ChatGPT-4o

chatgpt vs grok
Foto: Adobe Stock

Grok-2, naprednejši od obeh modelov, je namenjen ustvarjanju besedila, odpravljanju težav s kodo in izvajanju sorodnih nalog. Prav tako lahko analizira slike, ki jih posredujejo uporabniki. Grok-2 mini je pomanjšana različica, ki žrtvuje nekaj kakovosti izpisa za hitrejši odzivni čas in nižje stroške sklepanja.

V internem preizkusu je xAI primerjal Grok-2 z več konkurenčnimi modeli, da bi ocenil kakovost njegovih rezultatov. To ocenjevanje je vključevalo osem primerjalnih podatkovnih nizov, ki jih raziskovalci pogosto uporabljajo za merjenje natančnosti velikih jezikovnih modelov (LLM). Po podatkih xAI je Grok-2 dosegel raven zmogljivosti, ki je konkurenčna najnaprednejšim modelom LLM, ki so na voljo.

Eden od uporabljenih primerjalnih podatkovnih nizov, GPQA, vsebuje 448 vprašanj izbirnega tipa, ki pokrivajo različna znanstvena področja. Diplomanti programa LLM so ocenjeni glede na to, na koliko vprašanj so pravilno odgovorili. Grok-2 je dosegel rezultat 56, s čimer je presegel tako GPT-4o kot tudi nedavno izdani model Llama 3 405B podjetja Meta.

Edini program LLM, ki je bil v testu GPQA boljši od programa Grok-2, je bil Claude 3.5 Sonnet podjetja Anthropic PBC, ki je dosegel višje rezultate v večini referenčnih podatkovnih nizov, uporabljenih pri ocenjevanju, razen v dveh, ki sta vključevali matematična vprašanja. Po drugi strani je Grok-2 mini pri skoraj vseh primerjalnih naborih podatkov dosegel nižje rezultate kot drugi programi LLM.

Oba nova modela xAI sta bila ta torek na voljo v X za uporabnike s plačanimi naročninami Premium in Premium+. Do teh modelov LLM lahko dostopate prek vmesnika klepetalnega robota, podobnega ChatGPT. Xova implementacija Grok-2 je integrirana z modelom umetne inteligence tretje osebe, imenovanim FLUX.1, ki ga je razvilo zagonsko podjetje Black Forest Labs Inc. Ta model uporabnikom omogoča ustvarjanje slik z uporabo pozivov v naravnem jeziku.

Še ta mesec namerava xAI dati na voljo Grok-2 in Grok-2 mini prek vmesnika API, kar bo razvijalcem omogočilo, da te modele vključijo v svoje aplikacije. API bo vključeval nadzor kibernetske varnosti, orodje za analizo prometa in možnost namestitve modelov v podatkovnih centrih blizu končnih uporabnikov, da se zmanjša zakasnitev.

Generator slik, ki nima etičnih omejitev

Prve slike, ki so jih ustvarili uporabniki, kažejo, da funkcija ustvarjanja slik v storitvi Grok trenutno nima omejitev pri ustvarjanju slik političnih osebnosti, kar je možnost, ki jo raziskujejo številni uporabniki. Zaradi bližajočih se predsedniških volitev v ZDA se bo podjetje verjetno soočilo s pritiskom, da uvede omejitve za te funkcije.

Naročniki X Premium, ki imajo dostop do storitve Grok, so si seveda dali duška in objavljali različne sporne slike, med drugim tiste, na katerih sta Barack Obama užival kokain in Donald Trump v kompromitirajočih situacijah, na primer z nosečnico, ki je očitno podobna Kamali Harris, ali pa so nanjo kazali orožje. Ob prihajajočih ameriških volitvah in ob dejstvu, da se X že sooča s pregledom evropskih regulatorjev, ta situacija postavlja temelje za potencialni spopad glede nevarnosti generativne umetne inteligence.

Grok trdi, da ima varovala, ko ga vprašamo o njegovih omejitvah pri ustvarjanju slik. Uporabnikom zagotavlja, da se izogiba ustvarjanju slik, ki so pornografske, pretirano nasilne, sovražne ali spodbujajo nevarne dejavnosti. Poleg tega je previden pri ustvarjanju slik, ki bi lahko kršile avtorske pravice ali blagovne znamke, vključno z znanimi liki ali logotipi, in zavrača ustvarjanje slik, ki bi lahko zavajale ali škodovale drugim, kot so globoki ponaredki ali slike, ki vodijo do dejanske škode.

Vendar pa ta pravila morda niso dejansko uveljavljene politike, ampak so bolj verjetno zveneči odgovori, ki so bili ustvarjeni na kraju samem. Ponavljajoče se poizvedbe prinašajo različne različice teh pravil, nekatere s politikami, ki se zdijo za X nenavadne, na primer »upoštevajte kulturno občutljivost«. Podjetje xAI se glede vprašanja, ali so ta varovala zares implementirana, ni odzvalo. Medtem ko Grokova besedilna različica zavrača zahteve, kot je pomoč uporabnikom pri ustvrajnaju drog, kar je standardno za klepetalne robote, pa Grok dovoljuje slikovne pozive, ki bi bili na drugih platformah običajno blokirani.

OpenAI ima občutno bolj stroga varovala

OpenAI pa poleg pričakovanih prepovedi, kot je pornografija, zavrača tudi pozive, povezane z resničnimi ljudmi, nacističnimi simboli, škodljivimi stereotipi ali dezinformacijami in drugimi potencialno spornimi temami. Za razliko od Groka OpenAI na ustvarjene slike doda tudi vodni znak. Uporabniki so sicer uspeli prepričati večje klepetalne robote, da ustvarijo sporne slike, podobne omenjenim, vendar je za to običajno treba uporabiti sleng ali jezikovne obvoznice, takšne vrzeli pa so po odkritju običajno zaprte.

Grok ni edino orodje, ki lahko ustvari nasilne, spolne ali zavajajoče slike umetne inteligence. Odprtokodno programsko opremo, kot je Stable Diffusion, je mogoče spremeniti za ustvarjanje najrazličnejših vsebin z minimalnimi omejitvami. Vendar je Grokov pristop zelo nenavaden za spletnega klepetalnega robota velikega tehnološkega podjetja. Google je na primer popolnoma ustavil zmožnosti ustvarjanja slik svojega modela Gemini po sramotnem poskusu pretirane korekcije rasnih in spolnih stereotipov.

Neomejenost storitve Grok je nekako v skladu z Muskovim splošnim ignoriranjemm standardnih praks umetne inteligence in varnosti v družabnih medijih, vendar je bila uvedena v posebej občutljivem času. Evropska komisija že preiskuje podjetje X zaradi morebitnih kršitev zakona o digitalnih storitvah, ki ureja moderiranje vsebin na velikih spletnih platformah. V začetku letošnjega leta je od X in drugih podjetij zahtevala tudi informacije o njihovih prizadevanjih za zmanjšanje tveganj, povezanih z umetno inteligenco.

Vpn Slovenija
ExpressVPN

Hiter VPN, odličen za potovanja

NordVPN

Najbolj uveljavljen VPN. 63% popusta

CyberGhost

Hiter in varen VPN. Že od 2.19€/mesec

Poker Sobe
Bet365

100% do 25€ bonus za prvi depozit!

WPT Global

100% do $1500 bonus za prvi depozit!

PokerStars

100% do 600€ bonus za prvi depozit!