»Nano Banana«: Nov AI urejevalec slik, ki je čez noč postal viralen   

Home » »Nano Banana«: Nov AI urejevalec slik, ki je čez noč postal viralen   
nano banana ai
Foto: Adobe Stock

V zadnjih nekaj dnevih splet preplavljajo slike novega AI modela “Nano banana”. Izkazalo se je, da gre za novo posodobitev Googlovega Geminija. Poglejmo, kaj vse zmore.

Malo znano orodje umetne inteligence z imenom »nano banana« se je nepričakovano povzpelo na vrh LMArene, vodilne platforme za razvrščanje modelov umetne inteligence. Urejevalnik je dosledno premagoval tekmece v neposrednih obračunih in pritegnil pozornost skupnosti. Po mnogih ugibanjih pa je pa je Google DeepMind razkril resnico: nano banana sploh nikoli ni bil neznan tekmec, temveč kodno ime za Gemini 2.5 Flash Image.

Preberi še: 5 najboljših ChatGPT alternativ v 2025: Claude, Gemini, Perplexity, Copilot in Grok. Kateri je najboljši?

Najbolj natančen AI urejevalec slik doslej

Googlov najnovejši slikovni model Gemini je zasnovan tako, da obvlada podrobne popravke, vodene s preprostimi jezikovnimi navodili, pri tem pa ohrani ključne elemente – kot so obrazi, živali in drobne teksture – dosledne in nedotaknjene. To je področje, kjer se številni tekmeci še vedno spotikajo. Na primer, ko ChatGPT ali Groka podjetja xAI uporabimo zgolj za spremembo barve majice na fotografiji, orodja pogosto ustvarijo popačene poteze ali neželene spremembe ozadja.

Kaj vse zmore Nano Banana?

nano banana ai

Tukaj so glavne funkcije modela Gemini 2.5 Flash Image (Nano banana):

  • Generiranje in urejanje slik z besedilom: Z Nano Banana ne potrebujete naprednih oblikovalskih veščin ali zapletenih orodij. Dovolj je, da vtipkate navodilo v naravnem jeziku – na primer: »naj bo ta soba svetlejša s strešnim oknom« – in umetna inteligenca izvede spremembo. Tako odpade potreba po maskah, čopičih ali ročnem delu s plastmi, saj je intuitivna ustvarjalnost postavljena v ospredje.
  • Izjemna doslednost likov in prizorov: Za razliko od starejših AI-urejevalnikov, ki po več popravkih popačijo obraze ali predmete v ozadju, Nano Banana ohranja identiteto z impresivno natančnostjo. Ne glede na to, ali gre za isto osebo na več slikah ali za enako postavitev prostora, realističnost ostaja nedotaknjena.
  • Izjemno hitra obdelava: Ena najbolj opevanih lastnosti Nano Banane je njena hitrost. Generiranje in urejanje sta pogosto zaključena v nekaj sekundah, kar omogoča brezskrbno eksperimentiranje. Hiter cikel iteracij daje moč oblikovalcem, tržnikom in tudi priložnostnim uporabnikom, da v nekaj minutah preizkusijo na desetine različic – popolno za brainstorming, prototipe ali hitre prilagoditve med ustvarjalnimi procesi.
  • Združevanje več slik in prelivanje prizorov: Model zna inteligentno združevati vsebine iz različnih slik. Tako lahko na primer nov izdelek postavite v življenjski slog fotografijo ali pa združite več slogovnih elementov v eno skladno sliko. Obkrožajočo kuliso rekonstruira naravno, tako da rezultati ne delujejo umetno prilepljeni, temveč vizualno usklajeni.
  • Večstopenjsko interaktivno urejanje: Namesto da bi morali vsakič začeti znova, Nano Banana omogoča postopno izpopolnjevanje. Najprej lahko zahtevate spremembo barve, nato dodate rekvizite, nato prilagodite osvetlitev – pri čemer si AI zapomni prejšnje spremembe. Ta pogovorni, večstopenjski pristop omogoča, da se ista slika postopoma razvija proti vaši viziji, kar zmanjšuje frustracije in odvečno ponovno generiranje.
  • Vrhunska kakovost urejanja: Merila kažejo, da Nano Banana presega številne vodilne tekmece pri realističnosti in zadovoljstvu uporabnikov. Ustvarja ostre podrobnosti, naravno svetlobo in prepričljive teksture, hkrati pa ohrani bistvo vaše izvirne fotografije. Kreativni profesionalci ga še posebej koristno uporabljajo pri snovanju zgodb, oglaševalskih kampanjah in konceptualni umetnosti, kjer je verodostojnost ključna.
  • Dostopno prek aplikacije Gemini in drugih platform: Google je Nano Banana vključil v aplikacijo Gemini za splet, iOS in Android. Preizkusijo ga lahko tako brezplačni kot naročniški uporabniki, pri čemer naročniške stopnje določajo obseg urejanja. Njegova navzočnost na različnih platformah ga naredi široko dostopnega ter spodbuja vsakodnevno uporabo ob profesionalnih aplikacijah, brez visokih stroškov programske opreme.
  • Vgrajene zaščite: Da bi preprečili škodljivo zlorabo, Nano Banana blokira zahteve, ki vključujejo nevarne ali neprostovoljne vsebine. Vsaka ustvarjena slika vsebuje tudi metapodatke in nevidno vodno oznako SynthID. Ti varovalni ukrepi zagotavljajo večjo preglednost in odgovornost, pomagajo razlikovati stvaritve z AI-pomočjo ter zmanjšujejo tveganja dezinformacij ali neetične rabe na družbenih in profesionalnih platformah.

Preberi še: Kako uporabiti ChatGPT za trgovanje s kriptovalutami: Vodnik za slovenske uporabnike 2025

Tekma za prevlado na področju AI ustvarjanja slik se zaostruje

Ustvarjanje slik z umetno inteligenco je hitro postalo eno najbolj neusmiljenih bojišč v tekmovanju med tehnološkimi velikani. Ko je OpenAI marca predstavil vgrajeni slikovni generator GPT-4o, je sprožil viralni val memov v slogu Studia Ghibli, ki je ChatGPT-ju prinesel množičen porast uporabe – tako intenziven, da se je izvršni direktor Sam Altman pošalil, da se »GPU-ji talijo«.

Tekmeci hitijo dohiteti tempo. Samo prejšnji teden je Meta napovedala načrte za licenciranje slikovnih modelov pri Midjourneyu, medtem ko nemški startup Black Forest Labs, podprt s strani a16z, še naprej objavlja rekordne rezultate s svojimi modeli FLUX.

Google upa, da bo njegov novi slikovni urejevalnik Gemini zmanjšal zaostanek za OpenAI-jem. Danes ima ChatGPT več kot 700 milijonov tedenskih uporabnikov, medtem ko je Sundar Pichai na julijskem pogovoru o zaslužkih poročal, da ima Gemini 450 milijonov mesečnih uporabnikov – številko, ki nakazuje precej manjšo tedensko bazo.