Google lansiral Gemini 2.0, a OpenAI še vedno zmaguje UI bitko v 2024

Home » Google lansiral Gemini 2.0, a OpenAI še vedno zmaguje UI bitko v 2024

Google je te dni izdal izboljšan UI model Gemini 2.0, Anthropic pa Claude 3.5 Haiku. Toda 2024 pripada OpenAI.

Google je ta teden predstavil model Gemini 2.0, s katerim je predstavil svoj najnovejši model umetne inteligence z avtonomnimi zmožnostmi in večmodalnimi funkcijami.

Ta poteza poudarja Googlovo vizijo, da se klepetalni roboti z umetno inteligenco razvijejo v agente z umetno inteligenco – napredno programsko opremo, ki uporablja generativno umetno inteligenco za interakcijo z uporabniki, razumevanje njihovih potreb in izvajanje nalog v realnem času. Izboljšana multimodalnost, vključno z nativnim slikovnim in zvočnim izhodom ter integrirano uporabo orodij, pomeni pomemben korak k oblikovanju univerzalnega pomočnika, ki temelji na umetni inteligenci.

Novi model, ki temelji na multimodalnih temeljih programa Gemini 1.5, vključuje nativno generiranje slik, zmožnosti pretvorbe besedila v govor in izboljšane sposobnosti sklepanja. Različica 2.0 Flash naj bi v ključnih primerjalnih testih presegla model 1.5 Pro, hkrati pa deluje z dvakrat večjo hitrostjo. Trenutno je ta model na voljo uporabnikom, ki so naročeni na storitev Google Advanced, vrhunsko storitev, ki je zasnovana kot konkurenca storitvam Claude in ChatGPT Plus.

Uporabniki lahko izkoristijo polno moč Gemini 2.0 preko storitve Google AI Studio

Za tiste, ki so pripravljeni na bolj praktičen pristop, ponuja Google AI Studio bolj robustno in funkcionalno izkušnjo za dostop do programa Gemini. Vendar je ta vmesnik v primerjavi s preprostim in uporabniku prijaznim dizajnom programa Gemini še bolj zapleten.

Različica Studio je sicer zmogljivejša, vendar precej počasnejša. Pri naših preskusih je analiza dokumenta s 60.000 žetoni trajala skoraj 9 minut, vendar je bil rezultat presenetljivo natančen in brez halucinacij. Pri daljših dokumentih z okoli 150.000 žetoni (približno 90.000 besed) se čas obdelave znatno poveča, vendar je model sposoben opraviti tudi takšne naloge, če ste potrpežljivi.

Google je v programu Gemini Advanced uvedel tudi novo funkcijo “Deep Research”, ki izkorišča izboljšano sklepanje in zmožnosti dolgih kontekstov za obravnavo zapletenih tem in ustvarjanje podrobnih poročil. Ta funkcija uporabnikom omogoča, da teme raziščejo bolj poglobljeno, kot bi to storili s preprostejšimi modeli, ki so zasnovani za hitre in enostavne odgovore. Vendar trenutno temelji na različici Gemini 1.5, časovnega okvira za nadgradnjo na različico Gemini 2.0 pa ni.

S funkcijo Deep Research je Gemini konkurent storitvam, kot so Perplexity Pro, You.com’s Research Assistant in BeaGo. Vendar se Google razlikuje po tem, da ponuja raven nadzora in prilagajanja brez primere. Pred začetkom naloge model pripravi podroben načrt, ki ga lahko uporabniki spremenijo tako, da dodajo ali odstranijo raziskovalno gradivo, vključijo določene podrobnosti ali spremenijo pristop. Ko je metodologija dokončno oblikovana, lahko uporabniki klepetalnemu robotu naročijo, naj začne z raziskovanjem. Ta raven nadzora je neprimerljiva z drugimi storitvami umetne inteligence.

Google je dodal tudi novega multimodalnega asistenta: Project Astra

Google je v promocijskem videoposnetku, ki ga poganja program Gemini 2.0, predstavil svojega eksperimentalnega pomočnika z umetno inteligenco Project Astra. Astra, ki je zasnovana kot neposredna konkurenca Meta AI, sodeluje z uporabniki v realnem času, pri čemer za vnos podatkov uporablja kamero in mikrofon pametnega telefona ter zagotavlja glasovne odgovore.

Projekt Astra je opremljen z izboljšanimi funkcijami, vključno s podporo večjezičnim pogovorom z izboljšanim prepoznavanjem naglasa, nemoteno integracijo z iskalnikom Google Search, Lens in zemljevidi, razširjenim pomnilnikom, ki ohranja do 10 minut konteksta pogovora, možnostjo dolgoročnega spomina in zmanjšano latenco pogovora z napredno tehnologijo pretakanja. Medtem ko je predstavitveni videoposnetek s samo 120.000 ogledi v družabnih medijih pritegnil skromno pozornost, je širše uvajanje družine modelov Gemini 2.0 deležno vse večjega zanimanja. Ta porast se kaže v povečanem številu spletnih iskanj, k čemur je verjetno pripomogla tudi napoved, ki je sovpadala z velikim izpadom programa ChatGPT Plus.

UI bitki pa se pridružuje tudi tretji borec: Anthropicov Claude 3.5 Haiku

Ne smemo pa pozabiti niti na tretjega kandidata – Anthropic, ki je malo tišje izdal Claude 3.5 Haiku.

Anthropic je novembra predstavil model 3.5 Haiku in predstavil model, ki je po ključnih merilih enak ali boljši od predhodnika 3 Opus. Program 3.5 Haiku, ki je zasnovan za naloge, kot so priporočila za kodiranje, pridobivanje in označevanje podatkov ter moderiranje vsebine, ponuja izboljšane zmogljivosti.

Ena od njegovih izstopajočih funkcij je zmožnost ustvarjanja daljših besedilnih izpisov v primerjavi s programom 3 Haiku, skupaj s posodobljeno mejo znanja, ki omogoča sklicevanje na novejše dogodke. Vendar nima zmogljivosti za analizo slik, zato je v tem pogledu manj vsestranski v primerjavi z modeli, kot sta 3 Haiku in 3.5 Sonnet. Model je sprožil nekaj polemik, potem ko je bil prejšnji mesec vključen v Anthropicov API. Sprva je Anthropic predlagal, da bo njegova cena enaka ceni modela 3 Haiku, pozneje pa je upravičil višjo ceno API in navedel višjo “inteligenco“ in zmogljivosti modela.

Google in Anthropic sta uskladila ceno svoje premijske storitve na 20 dolarjev na mesec, kar je enako ceni osnovne stopnje ChatGPT Plus podjetja OpenAI.