Još jedan tjedan u tehnološkoj industriji donosi nam još jedan "pametniji" AI model. Google je danas službeno lansirao Gemini 3.1 Pro, najnoviju iteraciju svog jezičnog modela, s tvrdnjom da donosi dramatičan napredak u rješavanju kompleksnih problema.
Nakon što je prethodni model, Gemini 3, od svog izlaska u studenom prošle godine nadmašio konkurente poput Copilota u brojnim internim testovima, Google sada podiže ljestvicu. Prema navodima tvrtke, novi Gemini 3.1 Pro ostvaruje "više nego dvostruko bolje performanse rezoniranja" u usporedbi sa svojim prethodnikom.
Brojke iza inteligencije: HLE i ARC-AGI-2 testovi
Pravi pokazatelj snage novih modela leži u sve rigoroznijim testiranjima. Gemini 3.1 Pro ostvario je rezultat od 77,1 posto na ARC-AGI-2 benchmarku, testu dizajniranom za evaluaciju potpuno novih logičkih obrazaca.
Zanimljiv je i napredak na takozvanom "Posljednjem ispitu čovječanstva" (Humanity's Last Exam - HLE). Ovaj je test osmišljen kao odgovor na činjenicu da AI modeli sve lakše rješavaju standardne industrijske testove, te služi za preciznije mjerenje napretka u odnosu na ljudske sposobnosti. Dok je Gemini 3 krajem prošle godine postavio rekord s 38,3 posto, Gemini 3.1 Pro sada podiže taj rezultat na 44,4 posto.
Duboko promišljanje za znanstvene proboje
Lansiranje modela 3.1 Pro dolazi samo tjedan dana nakon velikog ažuriranja nazvanog Gemini 3 Deep Think. Ta je nadogradnja donijela impresivne sposobnosti u područjima kemije, fizike, matematike i programiranja.
Google ističe da je Deep Think izgrađen za rješavanje "teških istraživačkih izazova" – problema koji nemaju jasne okvire ili jedno točno rješenje, a podaci su često neuredni ili nepotpuni. U tom kontekstu, Gemini 3.1 Pro služi kao nadograđena temeljna inteligencija (engine) koja zapravo omogućuje te znanstvene proboje. (Vrijedi napomenuti da je specifična Deep Think verzija na testovima ostvarila i više rezultate: 48,4 posto na HLE-u te 84,6 posto na ARC-AGI-2 testu).
Konkurencija ne spava
Unatoč Googleovim impresivnim brojkama, bitka za AI tron daleko je od gotove. Prema ljestvici Centra za sigurnost umjetne inteligencije (CAIS), model Claude Opus 4.6 tvrtke Anthropic i dalje drži prvo mjesto u tekstualnim mogućnostima i rezoniranju izvan HLE testova.
Također, kada je riječ o procjeni rizika i sigurnosti, CAIS-ova ljestvica pokazuje da Anthropicovi modeli (Opus 4.5, Sonnet 4.5 i Opus 4.6) i dalje nadmašuju Googleovu trojku.
David Gewirtz, viši urednik na portalu ZDNET, smiruje euforiju i podsjeća na širi kontekst:
"Rezultati testiranja sugeriraju značajno poboljšanje u odnosu na Gemini 3, koji je već bio vrlo dobar. Ipak, pravi doseg nećemo znati odmah, pogotovo jer je novi model trenutno dostupan samo korisnicima skupljih pretplatničkih paketa. Također, još uvijek čekamo odgovor OpenAI-ja s modelom GPT-5.3. Tek kada on izađe, imat ćemo jasniju sliku o tome tko vodi u ovoj generaciji."
U međuvremenu, industrija pomno prati i nedavno lansirani GPT-5.3-Codex, OpenAI-jev model specijaliziran za programiranje koji je slavno pomogao u vlastitoj izgradnji.
Gdje isprobati Gemini 3.1 Pro?
Google je novi model odmah učinio dostupnim kroz različite kanale, ovisno o tipu korisnika:
-
Za programere (Preview): Dostupno putem API-ja u Google AI Studiju, Android Studiju, Google Antigravityju te kroz Gemini CLI.
-
Za poslovne korisnike (Enterprise): Dostupno u Vertex AI i Gemini Enterprise okruženjima.
-
Za privatne korisnike: Model je integriran u alat NotebookLM te unutar standardne Gemini aplikacije.
