Google je danas predstavio najnoviju generaciju svog AI modela - Gemini 2.0, koji sada podržava komunikaciju „slikom i zvukom“ te nešto što Google, u nedostatku boljeg prijevoda, naziva “agentičkom erom”.
Agentski AI modeli predstavljaju AI sustave koji mogu samostalno izvršavati zadatke uz „podešavajuće“ donošenje odluka. Primjer bi trebala biti automatizacija zadataka poput kupnje ili zakazivanja termina sastanka.
Gemini 2.0 će sadržavati višestruke agente koji vam mogu pomoći na raznim poljima, od davanja prijedloga u stvarnom vremenu u igrama, do odabira poklona i dodavanja u vašu košaricu na temelju upita.
Kao i drugi AI agenti, oni u Geminiju 2.0 ponašaju se orijentirano na cilj. Mogu stvoriti popis koraka temeljen na zadacima i samostalno ih izvršiti. U najnoviju verziju uključeni su Project Astra, dizajniran kao univerzalni AI pomoćnik za Android telefone s multimodalnom podrškom i integracijom Google pretraživanja, Lens sustava i Karata (Google Maps).
„Project Mariner“ je još jedan eksperimentalni AI agent koji se može sam kretati unutar web preglednika. Kao Chrome ekstenzija, dostupan je ograničenom broju testnih korisnika.
Tu je i Gemini 2.0 Flash eksperimentalna (beta) verzija s nižom latencijom, boljom referentnom izvedbom i poboljšanim razmišljanjem i razumijevanjem matematike i kodiranja u usporedbi s modelima Gemini 1.0 i 1.5. Može generirati slike koje izvorno pokreće Google DeepMind Imagen 3 model pretvaranja teksta u sliku, odnosno generiranja ilustracije na osnovu tekstualnog upita.
Gemini 2.0 Flash Experimental dostupan je na webu za sve korisnike i uskoro dolazi u mobilnu aplikaciju Gemini. Korisnici koji ga žele isprobati morat će odabrati Gemini 2.0 Flash Experimental.