Zhrnutie článku:
- Dominancia v testoch: Gemini 3 Pro a Deep Think prekonávajú modely GPT-5.1 a Claude Sonnet 4.5 v kľúčových benchmarkoch uvažovania.
- Režim Deep Think: Nový mód hlbokého myslenia dosahuje PhD. úroveň v riešení komplexných vedeckých a vizuálnych problémov bez halucinácií.
- Revolúcia pre vývojárov: Google predstavil Antigravity, platformu pre autonómnych agentov, ktorí dokážu samostatne plánovať, kódovať a ovládať prehliadač.
Spoločnosť Google dnes urobila zásadný krok smerom k všeobecnej umelej inteligencii (AGI) predstavením modelu Gemini 3. Tento najnovší model sľubuje bezkonkurenčné schopnosti v logickom uvažovaní, multimodálnom chápaní a autonómnom plánovaní, pričom je od prvého dňa integrovaný priamo do Vyhľadávania Google a nástrojov pre vývojárov.
Dva roky po spustení prvého Gemini prichádza Google s treťou generáciou, ktorá sľubuje viac než len rýchlejšie odpovede. Gemini 3 je podľa slov CEO Sundara Pichaiho vyvrcholením snáh spojiť infraštruktúru, výskum a produkt do jedného celku, schopného nielen spracovať informácie, ale skutočne chápať kontext a zámery používateľa.
Model prichádza v dvoch hlavných variantoch – všestrannom Gemini 3 Pro pre každodenné úlohy a špecializovanom Gemini 3 Deep Think pre tie najnáročnejšie logické výzvy.

Deep Think: Keď AI začne skutočne premýšľať
Najväčšou technologickou novinkou je predstavenie režimu Gemini 3 Deep Think. Tento mód nie je optimalizovaný na okamžitú reakciu, ale na riešenie problémov vyžadujúcich hlbokú analýzu a vedeckú presnosť, pri ktorých si model „rozoberie“ zadanie na vrstvy podobne ako človek.
Priepastný rozdiel medzi novinkou od Google a zvyškom trhu najlepšie ilustrujú výsledky v benchmarku Humanity’s Last Exam (HLE). Tento test akademického uvažovania bol dlho pre AI neriešiteľným orieškom, no Gemini 3 Deep Think v ňom dosiahol skóre 41 %, čím nechal ďaleko za sebou konkurenčný GPT-5.1 s 26,5 % aj Claude Sonnet 4.5, ktorý dosiahol len 13,7 %.
Dominancia nového modelu sa potvrdila aj v teste vedeckých znalostí GPQA Diamond, kde sa s výsledkom 93,8 % pohybuje na úrovni špičkových expertov. Ešte pôsobivejší je výkon vo vizuálnych hádankách ARC-AGI-2, ktoré sú mnohými považované za meradlo skutočnej všeobecnej inteligencie. S podporou nástrojov tu Gemini 3 dosiahol skóre 45,1 %, čo je takmer trojnásobok oproti modelu od Anthropicu a výrazný skok oproti 17,6 % pri GPT-5.1.

Multimodalita v praxi: Od varenia po Pickleball
Gemini 3 posúva hranice toho, čo znamená „natívna multimodalita“. Nejde len o analýzu statických obrázkov, ale o pochopenie dynamického sveta, čo potvrdzuje skóre 87,6 % v teste Video-MMMU.
V praxi to znamená, že používateľ môže nahrať video svojho športového výkonu, napríklad zápasu v Pickleballe, a model mu vygeneruje tréningový plán na zlepšenie formy. Rovnako si poradí s ťažko čitateľnými ručne písanými receptami, ktoré prevedie do digitálnej podoby, alebo dokáže analyzovať zložité vedecké videá a na ich základe vytvoriť interaktívnu vizualizáciu priamo vo výsledkoch vyhľadávania. V teste multimodálneho uvažovania MMMU-Pro model dosiahol 81,0 %, čím opäť prekonal konkurenciu.

Google Antigravity a budúcnosť kódovania
Pre vývojársku komunitu je kľúčovou správou spustenie platformy Google Antigravity. Google tu mení paradigmu z „AI asistentov“ na autonómnych „AI agentov“. V tomto novom vývojovom prostredí (IDE) už programátor nespolupracuje len s našepkávačom kódu, ale s partnerom, ktorý má prístup k terminálu, prehliadaču a editoru kódu súčasne.
Tento prístup, nazývaný agentic coding, umožňuje modelu autonómne plánovať architektúru, písať kód a následne ho testovať ako reálny používateľ v prehliadači vďaka integrácii modelu Gemini 2.5 Computer Use. Schopnosti v reálnom svete potvrdzuje benchmark SWE-Bench Verified, kde Gemini 3 dosiahol 76,2 % úspešnosť na prvý pokus. Súčasťou platformy je aj nový model na úpravu obrázkov „Nano Banana“, ktorý umožňuje generovať grafické podklady priamo počas vývoja aplikácie.
Dlhodobé plánovanie: Test predajného automatu
Jedným z najväčších problémov súčasných AI modelov je neschopnosť udržať stratégiu v dlhom časovom horizonte. Google preto demonštroval schopnosti novinky na teste Vending-Bench 2, ktorý simuluje riadenie biznisu s predajnými automatmi počas celého roka.
Výsledky hovoria jasnou rečou. Zatiaľ čo konkurenčné modely vykazovali stagnáciu alebo volatilitu, Gemini 3 Pro dosiahol stabilný lineárny rast zisku, končiaci na priemernej hodnote 5478 USD.
Pre porovnanie, Claude Sonnet 4.5 skončil na úrovni približne 3800 USD s výraznými prepadmi, a GPT-5.1 dosiahol len okolo 1500 USD. Tento výsledok dokazuje, že nový model dokáže spoľahlivo používať nástroje a robiť strategické rozhodnutia počas stoviek krokov bez toho, aby „zišiel z cesty“ alebo sa zacyklil v chybách.
Dostupnosť a bezpečnosť
S príchodom takto výkonného modelu kladie Google dôraz na bezpečnosť. Gemini 3 prešiel najrozsiahlejším testovaním v histórii firmy, vrátane auditov externých expertov, a vykazuje vyššiu odolnosť voči manipulácii.
Model Gemini 3 Pro je už oddnes dostupný v aplikácii Gemini, v nástrojoch AI Studio a Vertex AI, a v USA poháňa nový AI Mode vo Vyhľadávaní. Výkonnejší režim Deep Think bude sprístupnený predplatiteľom Google AI Ultra v najbližších týždňoch po finálnom doladení.
Tu je prehľadná porovnávacia tabuľka kľúčových benchmarkov, ktorá ukazuje dominanciu modelu Gemini 3 (v režimoch Deep Think a Pro) oproti súčasnej špičke. Môžete ju vložiť na záver článku pre rýchle zhrnutie.
Porovnanie s konkurenciou: Gemini 3 vs. GPT-5.1 vs. Claude Sonnet 4.5
| Benchmark (Kategória) | Gemini 3* | GPT-5.1 | Claude Sonnet 4.5 |
| Humanity’s Last Exam (Akademické uvažovanie) | 41,0 % | 26,5 % | 13,7 % |
| GPQA Diamond (Vedecké znalosti) | 93,8 % | 88,1 % | 83,4 % |
| ARC-AGI-2 (Vizuálne uvažovanie + nástroje) | 45,1 % | 17,6 % | 13,6 % |
| MMMU-Pro (Multimodálne chápanie) | 81,0 % | 76,0 % | 68,0 % |
| Vending-Bench 2 (Dlhodobé plánovanie – zisk) | $5 478 | $1 473 | $3 839 |
| MathArena Apex (Súťažná matematika) | 23,4 % | 1,0 % | 1,6 % |
*Údaje pre Gemini 3 predstavujú najvyššie dosiahnuté skóre (kombinácia režimov Deep Think a Pro).
Zdroj: Zdroj 1
