
Najslavnejši klepetalni robot ChatGPT, ki je novembra 2022 spremenil svet, je dobil svojo »mini« verzijo. V čem se razlikuje od običajne?
OpenAI je predstavil GPT-4o mini, manjšo različico svojega najnovejšega jezikovnega modela umetne inteligence GPT-4o, ki bo v ChatGPT nadomestil GPT-3.5 Turbo. Novi model je bil najprej na voljo brezplačnim uporabnikom in uporabnikom z naročninami ChatGPT Plus ali Team, uporabnikom ChatGPT Enterprise pa bo na voljo že ta teden.
GPT-4o mini bo po pričakovanjih večmodalen, podobno kot njegova večja različica, ki je bila izdana maja, s slikovnimi vhodi, ki so trenutno omogočeni v vmesniku API. OpenAI je navedel, da bo GPT-4o mini v prihodnosti lahko interpretiral slike, besedilo in zvok ter ustvarjal slike.
Model podpira 128K žetonov vhodnega konteksta in ima mejno vrednost znanja oktobra 2023. Kot izdelek API je tudi zelo stroškovno učinkovit, saj stane 15 centov na milijon vhodnih žetonov in 60 centov na milijon izhodnih žetonov, kar je 60% manj kot GPT-3.5 Turbo. Žetoni (tokens) so deli podatkov, ki jih jezikovni modeli umetne inteligence uporabljajo za obdelavo informacij.
Podjetje OpenAI je napovedalo, da bo GPT-4o mini prvi model umetne inteligence podjetja, ki bo izvajal novo tehniko, imenovano »hierarhija navodil«. Ta tehnika daje nekaterim navodilom prednost pred drugimi, zaradi česar lahko uporabniki model težje izkoristijo za napade z »vbrizgavanjem pozivov«, jailbreak ali pridobivanje sistemskih pozivov. Cilj teh vrst napadov je zaobiti vgrajeno fino nastavitev modela ali direktive, določene s sistemskimi pozivi.
Kako zmogljiv je GPT-4o mini?
OpenAI navaja, da je GPT-4o mini boljši od najboljših malih modelov umetne inteligence pri nalogah, ki vključujejo sklepanje z besedilom in vizualnimi vsebinami. Manjši modeli umetne inteligence so med razvijalci vse bolj priljubljeni zaradi svoje hitrosti in stroškovnih prednosti pred večjimi modeli, kot sta GPT-4 Omni ali Claude 3.5 Sonnet. Ti kompaktni modeli so idealni za opravljanje preprostih in obsežnih nalog, pri katerih je model umetne inteligence pogosto potreben.
GPT-4o mini bo nadomestil GPT-3.5 Turbo kot najmanjša ponudba OpenAI. Po podatkih podjetja Artificial Analysis je novi model dosegel 82-odstotni rezultat v primerjalnem testu MMLU, ki ocenjuje zmožnosti sklepanja, in je boljši od modelov Gemini 1.5 Flash (79%) in Claude 3 Haiku (75%). Poleg tega je model GPT-4o mini dosegel 87% točk pri merilu MGSM, ki meri matematično sklepanje, v primerjavi z 78 % pri modelu Flash in 72% pri modelu Haiku.
Ampak to pa ni vsa resnica. Po podatkih OpenAI je novi model GPT-4o mini na lestvici LMSYS Chatbot Arena, ki ocenjuje ocene uporabnikov po naključni primerjavi modelov, prehitel lanski model GPT-4 Turbo. Vendar ta metrika v skupnosti umetne inteligence postaja vse manj zanesljiva. Kljub temu da GPT-4o na lestvici dosledno prekaša GPT-4 Turbo, na splošno pogosto proizvaja manj praktične rezultate, kot so predolgi odgovori ali izvajanje nalog, ki niso bile zahtevane.
Nova orodja OpenAI za ChatGPT Enterprise
Poleg tega je OpenAI sočasno napovedal nova orodja za poslovne stranke. V objavi na blogu je podjetje predstavilo API Enterprise Compliance, ki je namenjen podjetjem v reguliranih sektorjih, kot so finance, zdravstvo, pravne storitve in vlada, da izpolnijo zahteve glede beleženja in revizije.
Ta orodja bodo skrbnikom omogočila revizijo in upravljanje podatkov ChatGPT Enterprise. API bo zagotavljal zapise interakcij s časovnim žigom, vključno s pogovori, naloženimi datotekami, uporabniki delovnega prostora in drugimi podatki. Poleg tega OpenAI skrbnikom omogoča podrobnejši nadzor nad GPT za delovne prostore, ki so prilagojene različice ChatGPT, prilagojene posebnim poslovnim aplikacijam. Prej so lahko upravitelji v celoti dovolili ali blokirali le dejanja GPT v svojem delovnem prostoru. Zdaj lahko lastniki delovnega prostora ustvarijo seznam odobrenih domen, s katerimi lahko GPT-ji komunicirajo.
Majhni jezikovni modeli v porastu
OpenAI ni prvo podjetje, ki je predstavilo manjšo različico obstoječega jezikovnega modela. To je običajna praksa v industriji umetne inteligence, saj so manjše modele objavila tudi podjetja, kot so Meta, Google in Anthropic. Ti manjši modeli so zasnovani tako, da z nižjimi stroški opravljajo preprostejše naloge, kot so sestavljanje seznamov, povzemanje vsebine ali predlaganje besed, namesto da bi opravljali poglobljeno analizo.
Običajno so ti manjši modeli namenjeni uporabnikom API, ki plačajo fiksno ceno na žeton za vnos in izpis, da lahko modele vključijo v svoje aplikacije. Vendar bi lahko brezplačna ponudba GPT-4o mini kot del ChatGPT družbi OpenAI pomagala zmanjšati stroške.
Manjši veliki jezikovni modeli (LLM) imajo na splošno manj parametrov kot večji modeli. Parametri so numerične vrednosti v nevronski mreži, ki shranjujejo naučene informacije. Z manjšim številom parametrov ima LLM manjšo nevronsko mrežo, kar pogosto omejuje globino kontekstualnega razumevanja umetne inteligence. Nasprotno pa imajo večji modeli z več parametri zaradi večjega števila povezav med shranjenimi koncepti običajno večjo zmogljivost za kompleksno sklepanje.
Morda vas bo zanimalo: