Ako ste posljednjih tjedana primijetili nevjerojatno realistične videozapise s neobičnim ili fantastičnim prizorima, velika je vjerojatnost da iza njih stoji Googleov AI alat Veo3, integriran u Gemini platformu. Ovaj alat postavlja novi standard u generiranju videozapisa umjetnom inteligencijom zahvaljujući iznimnom kontinuitetu kadrova, automatskom generiranju zvuka i vrhunskoj sinkronizaciji usana, što ga svrstava ispred konkurenata poput Runway AI ili dugo najavljivanog Sora modela iz OpenAI-ja. Upravo zbog tih karakteristika, Veo3 bilježi iznimnu popularnost, a prošlotjedno proširenje dostupnosti na sve Gemini pretplatnike dodatno je povećalo njegov doseg.
Sada Google najavljuje još jednu važnu nadogradnju: Veo3 dobiva mogućnost pretvaranja bilo koje postojeće slike u videozapis. Ova opcija dostupna je svim korisnicima Gemini Pro i Gemini AI Ultra pretplatničkih paketa u odabranim regijama. To znači da korisnici mogu pretvoriti vlastite fotografije iz galerije na mobitelu u kratke videoisječke, koji uz vizualne efekte uključuju i automatski generirani zvuk.
Iz Googlea pojašnjavaju kako je ova funkcionalnost od danas dostupna putem web sučelja Geminija, dok će na mobilnim aplikacijama za Android i iOS postati aktivna u narednim danima.
Značajka pretvaranja slike u video već je integrirana i u Googleovu platformu Flow, specijaliziranu za filmsko stvaralaštvo uz pomoć umjetne inteligencije. Flow korisnicima nudi naprednu kontrolu nad kompozicijom scene, kamerom, te omogućuje pohranu AI-generiranih elemenata („sastojaka“) za ponovno korištenje u različitim scenama.
Ipak, generiranje videozapisa uz pomoć Geminija dolazi s određenim ograničenjima. Svaki videozapis može trajati najviše osam sekundi, prikazuje se u rezoluciji do 720p i omjeru slike 16:9. Za korisnike Gemini Pro razine postavljeno je ograničenje od maksimalno 100 generiranih videa mjesečno, uz pretplatu od 20 dolara mjesečno. Opcija generiranja zvuka dostupna je isključivo korisnicima Gemini AI Ultra paketa, koji stoji znatno viših 250 dolara mjesečno.
Svi videozapisi stvoreni putem alata Veo3 automatski dobivaju vidljivi vodeni žig te skriveni SynthID potpis, što omogućuje njihovo jasno označavanje kao AI-generiranih. Osim borbe protiv dezinformacija, ovi vodenim žigovi Googleu mogu olakšati identifikaciju i eventualno ograničenje monetizacije AI sadržaja na YouTubeu, u skladu s novim pravilima usmjerenima na suzbijanje preplavljenosti platforme AI generiranim sadržajem niske kvalitete.
Ova nadogradnja Veo3 stiže samo nekoliko tjedana nakon što je konkurentski MidJourney predstavio vlastiti alat za generiranje videa. Za razliku od Googleovog rješenja, MidJourney dopušta upotrebu stvarnih fotografija isključivo kao referentnih slika za kreiranje novih AI fotografija, koje se naknadno mogu pretvoriti u kratke video isječke – ali bez zvuka. Upravo ta mogućnost generiranja zvuka daje Googleovom Veo3 jasnu prednost pred konkurencijom.