Alibaba lansirala Qwen 2.5: Je boljši od Deepseek in ChatGPT?

Home » Alibaba lansirala Qwen 2.5: Je boljši od Deepseek in ChatGPT?

Bitki za prevlado se je pridružil nov kitajski gigant – Alibaba, ki je po Deepseeku lansiral lastnega klepetalnega robota Qwen 2.5. Pa se lahko primerja s ChatGPT ali Deepseek? 

Bitka za prevlado v generativni umetni inteligenci se zaostruje, saj je Alibaba predstavila Qwen 2.5, s čimer je okrepila konkurenco na kitajskem trgu velikih jezikovnih modelov. Ta najnovejša poteza predstavlja neposreden izziv domačemu tekmecu DeepSeek, ki je decembra predstavil model DeepSeek-V3, temu pa je v začetku tega meseca sledila še posodobitev R1.

Kar DeepSeek-V3 loči od AI velikanov, kot so Claude, ChatGPT, Gemini, Llama in Perplexity, je njegova optimizirana arhitektura. V primerjavi s konkurenco je bil vzpostavljen bistveno hitreje in zahteval precej manj računalniške moči za učenje, kar ga postavlja kot učinkovitejšo alternativo prevladujočim sistemom umetne inteligence in je predvsem dodobra pognal »strah« v kosti ameriškim konkurentom.

Preberi še: Agenti UI: Najbolj vroča kripto zgodba 2025 + top UI kriptovalute za nakup

Kaj je Qwen 2.5 Max?

qwen 2.5
Foto: Adobe Stock

Alibaba, tehnološki velikan na Kitajskem, je sicer najbolj znana po svojem e-trgovinskem imperiju, vendar se je uveljavila tudi kot ključni igralec na področju računalništva v oblaku in umetne inteligence. Njena serija Qwen je osrednji del rastočega AI ekosistema, ki sega od kompaktnih odprtokodnih modelov do obsežnih lastniških sistemov. Za razliko od nekaterih prejšnjih različic Qwen2.5-Max ni odprtokoden, kar pomeni, da uteži modela niso javno dostopne.

Qwen2.5-Max se ponaša z obsežno bazo znanja in močnimi splošnimi zmožnostmi umetne inteligence. Vendar se razlikuje od modelov za logično sklepanje, kot sta DeepSeek R1 ali OpenAI-jev o1, saj ne prikazuje eksplicitnega poteka razmišljanja. Glede na agresiven AI razvoj Alibabe bi lahko kmalu sledil namenski model za sklepanje—morda Qwen 3.

Kako je Qwen 2.5 Max »natreniran«?

Qwen2.5-Max je bil usposobljen na osupljivih 20 bilijonih žetonov, kar znaša približno 15 bilijonov besed—ekvivalent 168 milijonom izvodov Orwellovega 1984. Vendar zgolj obsežna količina podatkov ni dovolj za ustvarjanje visokokakovostnega modela. Alibaba ga je dodatno izpopolnila z:

  • Supervised Fine-Tuning (SFT): Človeški označevalci so zagotovili strokovne povratne informacije za izboljšanje natančnosti.
  • Reinforcement Learning from Human Feedback (RLHF): Model je bil usposobljen za usklajevanje s človeškimi preferencami, kar omogoča bolj naravne in kontekstualno ustrezne odzive.

Kako se Qwen 2.5 primerja z Deepseek?

Na referenčnih testih je DeepSeek V3 pokazal vrhunsko zmogljivost, saj je presegel modele, kot sta Meta’s Llama 3.1 in Alibaba’s Qwen 2.5, hkrati pa se po zmožnostih kosa z OpenAI-jevim GPT-4o in Anthropicovim Claude 3.5 Sonnet. Posebej izstopa dejstvo, da je DeepSeek te rezultate dosegel z manj napredno strojno opremo, kar poudarja njegovo učinkovitost in uspešnost pristopa k učenju. Qwen 2.5 pa se je izkazal bolje od Deepseek po nekaterih parametrih.

Sredi preiskave o kraji intelektualne lastnine je izvršni direktor OpenAI Sam Altman v ponedeljek na platformi X priznal in pozdravil naraščajočo konkurenco podjetja DeepSeek v svetu umetne inteligence. Altman je pohvalil model DeepSeek R1, saj ponuja impresivne zmogljivosti, predvsem glede stroškovne učinkovitosti. Ob tem je samozavestno napovedal, da bo OpenAI še naprej razvijal boljše modele, a hkrati priznal, da ga prihod novega konkurenta spodbuja. Namignil je tudi na prihajajoče OpenAI izdaje kot odziv na vedno ostrejšo konkurenco.

Preberi še: Sam Altman: Prihajata virtualna delovna sila in splošna umetna inteligenca (AGI)

Pomisleki o kraji intelektualne lastnine

Čeprav še ni jasno, kateri kitajski AI model bo prevladal, se pojavljajo pomisleki glede možnih tveganj pri obeh platformah. Podobno kot pri kitajsko lastniškem TikToku se zdaj postavljajo vprašanja o varnosti podatkov, zasebnosti in morebitnem zavajanju pri predstavitvi zmogljivosti modelov Alibaba Qwen 2.5 in DeepSeek-V3. Dodatno zapletajo situacijo obtožbe o kraji intelektualne lastnine v povezavi z OpenAI in Microsoftom, kar sproža dvome o tem, ali je bil model V3 razvit samostojno ali je morda temeljil na obstoječih AI modelih.

Zaključna misel

Qwen2.5-Max je doslej najnaprednejši AI model podjetja Alibaba, zasnovan kot tekmec vodilnim industrijskim modelom, kot so GPT-4o, Claude 3.5 Sonnet in DeepSeek V3. Za razliko od prejšnjih modelov Qwen Qwen2.5-Max ni odprtokoden, vendar lahko uporabniki še vedno preizkusijo njegove zmogljivosti prek Qwen Chat ali ga integrirajo prek API dostopa na Alibaba Cloud. Ker Alibaba še naprej širi svojo prisotnost na področju umetne inteligence, bi lahko kmalu predstavila model, osredotočen na logično sklepanje—morda že s prihajajočim Qwen 3.