Meta je razkrila svojega novega paradnega konja v bitki za AI privlado, Llama 3. Ta je zdaj vključena v različne Meta produkte, kot so Facebook, Instagram in Whatsapp. Ima ChatGPT končno vredno konkurenco?
Marka Zuckerberga tudi neuspeh socialnega omrežja Threads ni vrgel iz tira. Meta je namreč lansirala program Llama 3, ki s svojimi naprednimi zmogljivostmi že buri duhove na trgu odprtokodne generativne umetne inteligence. Samo nekaj ur po začetku je bil model razglašen za najzmogljivejši odprto dostopni veliki jezikovni model (LLM) doslej. Z razponom modelov od 8 milijard do 70 milijard parametrov je Llama 3 zasnovan kot temelj za inovacije, ki je dostopen razvijalcem, raziskovalcem in podjetjem za različne aplikacije, vključno z naprednimi nalogami sklepanja in kodiranja.
ChatGPT, Gemini in ostali zmogljivi chatboti so tako dobili novo konkurenco, ki ji me manjka milijard dolarjev vredne podpore.
Kako dobra je Llama 3?
Cilj je, da Meta AI postane »najbolj inteligenten pomočnik z umetno inteligenco, ki ga lahko ljudje prosto uporabljajo po vsem svetu. In z Llama 3 se nam zdi, da smo že tam«, je izjavil Mark Zuckerberg. Usposabljanje programa Llama 3 je bilo bistveno intenzivirano, da lahko učinkovito uporablja velike količine podatkov, vključno s 15 bilijoni žetonov za večjo učinkovitost.
Zuckerberg je še sporočil, da sta se obe manjši različici modela Llama 3 z 8 oziroma 70 milijardami parametrov dobro odrezali v primerjavi z drugimi brezplačnimi modeli na podlagi standardnih meril uspešnosti, ki se uporabljajo za ocenjevanje kakovosti modelov. Opozoril je tudi, da se največja različica modela Llama 3, ki vsebuje 400 milijard parametrov, še vedno usposablja.
Meta je prav tako razvila lasten nabor testov, ki zajema primere uporabe od kodiranja in ustvarjalnega pisanja do sklepanja in povzemanja ter pri tem ugotovila, da je Llama 3 70B bil najboljši v primerjavi z modelom Mistral Medium, GPT-3.5 podjetja OpenAI in Claude Sonnet. Meta pravi, da je svojim ekipam za modeliranje preprečila dostop do nabora, da bi ohranila objektivnost, vendar je seveda – glede na to, da je Meta sama pripravila test – rezultate treba jemati z rezervo.
Meta pravi, da lahko uporabniki novih modelov Llama pričakujejo večjo »vodljivost«, manjšo verjetnost zavrnitve odgovora na vprašanja in večjo natančnost pri drobnih vprašanjih, vprašanjih, ki se nanašajo na zgodovino in področja STEM, kot sta tehnika in znanost, ter splošnih priporočilih za kodiranje. To je deloma posledica veliko večjega nabora podatkov: zbirka 15 bilijonov žetonov ali osupljivih ~750 000 000 000 000 besed – sedemkrat večja od učnega nabora modela Llama 2.
Kdaj lahko pričakujemo Llama 3 v Sloveniji?
Čeprav je bila do zdaj na voljo le v ZDA, se Meta AI zdaj v angleščini uvaja v Avstraliji, Kanadi, Gani, Jamajki, Malaviju, Novi Zelandiji, Nigeriji, Pakistanu, Singapurju, Južni Afriki, Ugandi, Zambiji in Zimbabveju, toda zaenkrat nismo zasledili planov, da bi jo lahko kmalu uporabljali v Sloveniji. To je še daleč od Zuckerbergovega načrta za resnično globalnega pomočnika z umetno inteligenco, vendar je s to širšo izdajo Meta AI bližje temu, da končno doseže več kot 3 milijarde dnevnih uporabnikov podjetja.
To lahko primerjamo s funkcijama Stories in Reels, dvema formatoma družbenih medijev, ki sta opredelila dobo in sta ju kot prva začela uporabljati nova podjetja – Snapchat oziroma TikTok -, nato pa sta bila dodana aplikacijam podjetja Meta na način, ki ju je naredil še bolj vsesplošna.
Vedno več gibanja za odportokodno umetno inteligenco
Metin novi model umetne inteligence, ki je odprtokoden, močno konkurira lastniškim sistemom glede zmogljivosti in inovacij ter izpodbija prevlado zaprtih modelov. Ti modeli z izboljševanjem spodbujajo več sodelovanja in partnerstev znotraj odprtokodne skupnosti, kar krepi ekosistem. Poleg Mete je podjetje xAI Elona Muska prek platform, kot sta GitHub in BitTorrent, naročnikom X Premium+ ponudilo svojega AI klepetalnega robota Grok. Ta poteza je skladna z Muskovo kritiko nepreglednosti OpenAI ter spodbuja širši dostop do umetne inteligence in inovacij.
Pomisleki
- Kritiki opozarjajo na tveganje, da se Llama 3 zaradi svojih zmogljivih zmogljivosti in odprtokodne dostopnosti uporablja za ustvarjanje globokih ponaredkov (deepfakes) ali širjenje dezinformacij.
- Ameriški senatorji so kritizirali Meta, ker podjetje ni uvedlo strožjega nadzora za preprečevanje izkoriščanja programa Llama 3 s strani zlonamernih akterjev.
- Odprtokodni modeli sicer spodbujajo preglednost in vključenost skupnosti, vendar poteka obsežna razprava o tem, kako te prednosti uravnotežiti s tveganji lažjega dostopa za slabe akterje.