
Google je na konferenci Google I/O 2025 predstavil osupljiva orodja za umetno inteligenco, med njimi je Veo 3, revolucionarni Ai generator videposnetkov.
Za nami je konferenca Google I/O 2025, kjer je tehnološki gigant poslal jasno sporočilo: Google gre s polno paro v umetno inteligenco.
At #GoogleIO, we shared how decades of AI research have now become reality.
— Sundar Pichai (@sundarpichai) May 20, 2025
From a total reimagining of Search to Agent Mode, Veo 3 and more, Gemini season will be the most exciting era of AI yet.
Some highlights 🧵 pic.twitter.com/2n9rbGNj0Q
Namesto postopnih izboljšav je Google predstavil val generativnih inovacij umetne inteligence, namenjenih popolni preobrazbi načina, kako iščemo, ustvarjamo in komuniciramo z digitalnimi mediji.
V središču vsega je Gemini, najnaprednejša družina Googlovih AI-modelov, ki je zdaj brezhibno vključena v ključne storitve – od izboljšanega iskanja do generiranja videov in izjemno podrobnih slik. Sporočilo je jasno: nova meja umetne inteligence je hitrost, tekoče delovanje in naravno ustvarjanje vsebin v različnih formatih.
Največ pozornosti je požel sistem Veo 3, Googlov prvi model za generiranje videoposnetkov. Ne ustvarja zgolj vizualnih vsebin – temveč tudi usklajene zvočne podlage, ambientalne učinke in celo govorjeni dialog. Zgolj na podlagi besedila in slik lahko uporabniki prejmejo v celoti izdelan video v ločljivosti 4K.
Veo 3 je prvi široko dostopen model, ki hkrati generira tako vizualne kot zvočne vsebine. Čeprav je bila zamisel prvič predstavljena z neuradnim modelom Showrunner Alpha, ga Googlov novi sistem presega z večjo ustvarjalno svobodo – omogoča produkcijo vsebin v najrazličnejših slogih, ne le v obliki stiliziranih risank, temveč tudi v kinematografskem in fotorealističnem formatu.
Preberi še: 20 aplikacij z umetno inteligenco, ki jih morate poznati v 2025!
Najbolj osupljiva funkcija Veo 3: Dodajanje zvoka, ki je sinhroniziran s sliko
Veo 3 je dostopen prek Googlove aplikacije Gemini chatbot za uporabnike, naročene na načrt AI Ultra, ki stane 250 USD na mesec. V aplikaciji je mogoče Veo 3 aktivirati z besedilnimi pozivi ali slikami.
Google ta izid predstavlja kot pomemben korak naprej na področju generiranja videa – od tihega vizualnega prikaza do popolnoma integrirane avdiovizualne vsebine. Uporabniki lahko vnesejo opis z liki, okoljem, predlaganim dialogom ter navodili glede tona in interpretacije. Model nato ustvari usklajen 4K video s pripadajočim zvokom.
> A man is running through a beautiful summer park at dawn, he is out of breath, he slows and stops, looks at the camera and says, while panting, "Run AI with an API. Use Replicate", then he carries on running. Then "Replicate" text fades into view at the end
— fofr (@fofrAI) May 20, 2025
Seems like the… https://t.co/ceQWQKO4XK pic.twitter.com/6kKBVWRk0L
Preberi še: Kaj je ChatGPT in 10 najboljših primerov uporabe v 2025
Veo 3: Ključne funkcije
Ustvarjalcem filma to AI orodje prinaša es osupkjive funkcije:
1. Generiranje zvoka na naraven način
Eden največjih prebojev pri Veo 3 je, da ne ustvarja le osupljivih videoposnetkov, temveč tudi zvok, ki deluje kot naravni del prizora. Od dialoga likov, ki je popolnoma usklajen z gibanjem ustnic, do ambientalnih zvočnih kulis in celo glasbene podlage – Veo 3 oživi video pozive na povsem nov način.
Predstavljajte si, da vnesete poziv: »par, ki hodi po deževni mestni ulici ponoči« – in prejmete video s koraki po mokrem pločniku, mehkim pljuskanjem dežja in oddaljenim brnenjem prometa. To je raven potopitve, ki jo ponuja Veo 3.
2. Realistični vizualni elementi in fizikalna dinamika
Veo 3 ni le vizualno privlačen – je videti resničen. Model tolmači besedilne pozive z impresivnim razumevanjem fizikalnih zakonitosti, kar pomeni, da boste v vsakem kadru dobili natančno gibanje, osvetlitev, odseve in teksture površin. Ne glede na to, ali želite divji avtomobilski pregon tipa Hitri in drzni ali rahel vetrič, ki se poigrava z listi dreves, Veo razume, kako naj se stvari premikajo in občutijo – zaradi česar so videoposnetki skorajda neprepoznavni od resničnih posnetkov.
3. Pametnejša obdelava pozivov in sestavljanje prizorov
Še ena izstopajoča funkcija je način, kako Veo 3 obravnava kompleksne pozive. Ne le da sledi navodilom – temveč jih tudi razume. Ne glede na to, ali opisujete interakcijo več likov, prehode čustvenih tonov ali večplastne prizore, Veo ohranja vse smiselno in usklajeno. Liki se obnašajo dosledno, okolja se razvijajo logično, celoten tok pa spoštuje vašo ustvarjalno vizijo. Kot bi imeli režiserjevega pomočnika, ki resnično razume, kaj želite ustvariti.
Nova funkcija za ustvarjanje filmov Flow
Flow je Googlov najnovejši AI-pogon za ustvarjanje videoposnetkov, predstavljen na konferenci Google I/O 2025. Gre za napredno orodje, zasnovano za ustvarjalce, ki omogoča hitro in intuitivno generiranje kratkih videoposnetkov z uporabo besedilnih ali slikovnih pozivov. Flow ne ponuja le osnovnega ustvarjanja videov, temveč prinaša tudi številna napredna orodja:
- Nadzor kamere: Uporabniki lahko ročno prilagajajo gibanje kamere, kote snemanja in perspektive – kar omogoča bolj filmsko in dinamično kompozicijo kadrov.
- Scenebuilder: Gre za orodje, ki omogoča nadaljevanje že ustvarjenih prizorov. Z njim lahko razširite prizor, razkrijete dogajanje iz drugega zornega kota ali dodate nov kader, ne da bi izgubili kontinuiteto likov, okolja ali gibanja.
- Upravljanje sredstev: Flow vključuje pametno knjižnico, kjer lahko urejate, kategorizirate in ponovno uporabljate svoje pozive, slike, prizore in druge kreativne elemente – idealno za kompleksnejše projekte.
- Flow TV: To je skupnostno središče, kjer si lahko ogledate posnetke drugih uporabnikov, ustvarjene z Veo. Vsak video vključuje podrobnosti o uporabljenih navodilih in tehnikah, kar omogoča vpogled v delovni proces drugih in ponuja konkretne ideje za lasten razvoj sloga ali pristopa.
Filmski ustvarjalci imajo mešane občutke
Področje generiranja videa postaja vse bolj zasičeno – številni startupi, kot so Runway, Pika, Genmo, Lightricks, Kling, Higgsfield in Luma, hitro predstavljajo lastne modele. V tekmo so vstopili tudi tehnološki velikani, kot sta OpenAI in Alibaba, kar ustvarja izjemno konkurenčno in pogosto težko razlikovalno okolje.
Veo 3 se naslanja na prejšnje raziskave podjetja DeepMind na področju umetne inteligence za sintezo zvoka iz videoposnetkov. Že sredi leta 2024 je podjetje predstavilo razvoj AI modelov, ki lahko samodejno ustvarjajo zvočne podlage za videe, in sicer z učenjem iz kombinacij zvočnih posnetkov, transkriptov dialoga in videoklipov.
Čeprav DeepMind ni razkril natančnih virov za učenje Veo 3, je precej verjetno, da je pri tem uporabil tudi YouTube. Google je namreč lastnik platforme YouTube, DeepMind pa je v preteklosti za nekatere svoje modele že namignil, da bi se lahko učili iz tamkajšnjih vsebin. Za preprečevanje zlorab, kot so deepfake videi, Google uporablja SynthID – lastniško tehnologijo za vodne žige, ki v vsak ustvarjen kader vstavi nevidne oznake, s katerimi je mogoče preveriti izvor in pristnost vsebine.
Kljub napredku, ki ga orodja, kot je Veo 3, prinašajo na področju ustvarjalnosti, pa številne ustvarjalce skrbi njihov vpliv na zaposlitev. Po podatkih študije, ki jo je leta 2024 naročil sindikat Animation Guild, naj bi do leta 2026 umetna inteligenca vplivala na več kot 100.000 delovnih mest v ameriški filmski, televizijski in animacijski industriji. To potrjuje, da AI ne prinaša zgolj novih priložnosti, temveč tudi konkretna tveganja za številne ustvarjalce.