Google odhalil Gemini 3: Nová éra AI prekonáva konkurenciu v uvažovaní, kódovaní aj dlhodobom plánovaní

SoftwareAplikácieGoogle odhalil Gemini 3: Nová éra AI prekonáva konkurenciu v uvažovaní, kódovaní...
Uložiť na neskôr
Odobrať zo záložiek

Zhrnutie článku:

  • Dominancia v testoch: Gemini 3 Pro a Deep Think prekonávajú modely GPT-5.1 a Claude Sonnet 4.5 v kľúčových benchmarkoch uvažovania.
  • Režim Deep Think: Nový mód hlbokého myslenia dosahuje PhD. úroveň v riešení komplexných vedeckých a vizuálnych problémov bez halucinácií.
  • Revolúcia pre vývojárov: Google predstavil Antigravity, platformu pre autonómnych agentov, ktorí dokážu samostatne plánovať, kódovať a ovládať prehliadač.

Spoločnosť Google dnes urobila zásadný krok smerom k všeobecnej umelej inteligencii (AGI) predstavením modelu Gemini 3. Tento najnovší model sľubuje bezkonkurenčné schopnosti v logickom uvažovaní, multimodálnom chápaní a autonómnom plánovaní, pričom je od prvého dňa integrovaný priamo do Vyhľadávania Google a nástrojov pre vývojárov.

Dva roky po spustení prvého Gemini prichádza Google s treťou generáciou, ktorá sľubuje viac než len rýchlejšie odpovede. Gemini 3 je podľa slov CEO Sundara Pichaiho vyvrcholením snáh spojiť infraštruktúru, výskum a produkt do jedného celku, schopného nielen spracovať informácie, ale skutočne chápať kontext a zámery používateľa.

Model prichádza v dvoch hlavných variantoch – všestrannom Gemini 3 Pro pre každodenné úlohy a špecializovanom Gemini 3 Deep Think pre tie najnáročnejšie logické výzvy.

Deep Think: Keď AI začne skutočne premýšľať

Najväčšou technologickou novinkou je predstavenie režimu Gemini 3 Deep Think. Tento mód nie je optimalizovaný na okamžitú reakciu, ale na riešenie problémov vyžadujúcich hlbokú analýzu a vedeckú presnosť, pri ktorých si model „rozoberie“ zadanie na vrstvy podobne ako človek.

- Inzercia -

Priepastný rozdiel medzi novinkou od Google a zvyškom trhu najlepšie ilustrujú výsledky v benchmarku Humanity’s Last Exam (HLE). Tento test akademického uvažovania bol dlho pre AI neriešiteľným orieškom, no Gemini 3 Deep Think v ňom dosiahol skóre 41 %, čím nechal ďaleko za sebou konkurenčný GPT-5.1 s 26,5 % aj Claude Sonnet 4.5, ktorý dosiahol len 13,7 %.

Dominancia nového modelu sa potvrdila aj v teste vedeckých znalostí GPQA Diamond, kde sa s výsledkom 93,8 % pohybuje na úrovni špičkových expertov. Ešte pôsobivejší je výkon vo vizuálnych hádankách ARC-AGI-2, ktoré sú mnohými považované za meradlo skutočnej všeobecnej inteligencie. S podporou nástrojov tu Gemini 3 dosiahol skóre 45,1 %, čo je takmer trojnásobok oproti modelu od Anthropicu a výrazný skok oproti 17,6 % pri GPT-5.1.

Multimodalita v praxi: Od varenia po Pickleball

Gemini 3 posúva hranice toho, čo znamená „natívna multimodalita“. Nejde len o analýzu statických obrázkov, ale o pochopenie dynamického sveta, čo potvrdzuje skóre 87,6 % v teste Video-MMMU.

- Inzercia -

V praxi to znamená, že používateľ môže nahrať video svojho športového výkonu, napríklad zápasu v Pickleballe, a model mu vygeneruje tréningový plán na zlepšenie formy. Rovnako si poradí s ťažko čitateľnými ručne písanými receptami, ktoré prevedie do digitálnej podoby, alebo dokáže analyzovať zložité vedecké videá a na ich základe vytvoriť interaktívnu vizualizáciu priamo vo výsledkoch vyhľadávania. V teste multimodálneho uvažovania MMMU-Pro model dosiahol 81,0 %, čím opäť prekonal konkurenciu.

Google Antigravity a budúcnosť kódovania

Pre vývojársku komunitu je kľúčovou správou spustenie platformy Google Antigravity. Google tu mení paradigmu z „AI asistentov“ na autonómnych „AI agentov“. V tomto novom vývojovom prostredí (IDE) už programátor nespolupracuje len s našepkávačom kódu, ale s partnerom, ktorý má prístup k terminálu, prehliadaču a editoru kódu súčasne.

Tento prístup, nazývaný agentic coding, umožňuje modelu autonómne plánovať architektúru, písať kód a následne ho testovať ako reálny používateľ v prehliadači vďaka integrácii modelu Gemini 2.5 Computer Use. Schopnosti v reálnom svete potvrdzuje benchmark SWE-Bench Verified, kde Gemini 3 dosiahol 76,2 % úspešnosť na prvý pokus. Súčasťou platformy je aj nový model na úpravu obrázkov „Nano Banana“, ktorý umožňuje generovať grafické podklady priamo počas vývoja aplikácie.

- Inzercia -

Dlhodobé plánovanie: Test predajného automatu

Jedným z najväčších problémov súčasných AI modelov je neschopnosť udržať stratégiu v dlhom časovom horizonte. Google preto demonštroval schopnosti novinky na teste Vending-Bench 2, ktorý simuluje riadenie biznisu s predajnými automatmi počas celého roka.

Výsledky hovoria jasnou rečou. Zatiaľ čo konkurenčné modely vykazovali stagnáciu alebo volatilitu, Gemini 3 Pro dosiahol stabilný lineárny rast zisku, končiaci na priemernej hodnote 5478 USD.

Pre porovnanie, Claude Sonnet 4.5 skončil na úrovni približne 3800 USD s výraznými prepadmi, a GPT-5.1 dosiahol len okolo 1500 USD. Tento výsledok dokazuje, že nový model dokáže spoľahlivo používať nástroje a robiť strategické rozhodnutia počas stoviek krokov bez toho, aby „zišiel z cesty“ alebo sa zacyklil v chybách.

Dostupnosť a bezpečnosť

S príchodom takto výkonného modelu kladie Google dôraz na bezpečnosť. Gemini 3 prešiel najrozsiahlejším testovaním v histórii firmy, vrátane auditov externých expertov, a vykazuje vyššiu odolnosť voči manipulácii.

Model Gemini 3 Pro je už oddnes dostupný v aplikácii Gemini, v nástrojoch AI Studio a Vertex AI, a v USA poháňa nový AI Mode vo Vyhľadávaní. Výkonnejší režim Deep Think bude sprístupnený predplatiteľom Google AI Ultra v najbližších týždňoch po finálnom doladení.

Tu je prehľadná porovnávacia tabuľka kľúčových benchmarkov, ktorá ukazuje dominanciu modelu Gemini 3 (v režimoch Deep Think a Pro) oproti súčasnej špičke. Môžete ju vložiť na záver článku pre rýchle zhrnutie.

Porovnanie s konkurenciou: Gemini 3 vs. GPT-5.1 vs. Claude Sonnet 4.5

Benchmark (Kategória)Gemini 3*GPT-5.1Claude Sonnet 4.5
Humanity’s Last Exam (Akademické uvažovanie)41,0 %26,5 %13,7 %
GPQA Diamond (Vedecké znalosti)93,8 %88,1 %83,4 %
ARC-AGI-2 (Vizuálne uvažovanie + nástroje)45,1 %17,6 %13,6 %
MMMU-Pro (Multimodálne chápanie)81,0 %76,0 %68,0 %
Vending-Bench 2 (Dlhodobé plánovanie – zisk)$5 478$1 473$3 839
MathArena Apex (Súťažná matematika)23,4 %1,0 %1,6 %

*Údaje pre Gemini 3 predstavujú najvyššie dosiahnuté skóre (kombinácia režimov Deep Think a Pro).

Zdroj: Zdroj 1

Inzercia

Mohlo by vás zaujímať

Komentáre k článku

ZANECHAŤ ODPOVEĎ

Pridajte svoj komentár!
Zadajte svoje meno tu
Captcha verification failed!
Používateľské skóre captcha zlyhalo. prosím kontaktuj nás!
Váš profil

Odporúčame