Včera spoločnosť OpenAI predstavila dvojicu nových „reasoning“ modelov, ktoré posúvajú hranice generatívnej AI v oblasti analýzy, multimodality aj autonómnej práce s nástrojmi.
Čo je nové
- o3 je vlajková loď série o‑models – prekonáva doterajší o1 vo výpočtoch, kódení, vede aj vizuálnej interpretácii a na akademických benchmarkoch (Codeforces, SWE‑bench, MMMU) nastavuje nové maximum.
- o4‑mini je odľahčená, nákladovo efektívna verzia s prekvapivo vysokým výkonom: na matematickej súťaži AIME 2025 dosiahla 99,5 % pass@1 (100 % consensus@8) pri využití Pythonu.
Oba modely boli trénované tak, aby premýšľali dlhšie pred odpoveďou a agenticky využívali všetky dostupné nástroje ChatGPT – od webového vyhľadávania cez Python až po analýzu a generovanie obrázkov.

Multimodálne „myslenie s obrazom“
Nové modely vkladajú obrázky priamo do svojho reťazca uvažovania: vedia rozpoznať rozmazanú fotku tabule, rotovať snímky či priblížiť detaily a použiť ich pri odvodení výsledku. Tým otvárajú doteraz nedosiahnuteľné scenáre – napríklad kombinovanie grafov, textu a kódu v jednom riešení.

Agentické používanie nástrojov
o3 aj o4‑mini samostatne rozhodujú, či je na riešenie úlohy treba stiahnuť dáta z webu, napísať skript, prípadne vizuálne upraviť obrázok. Celý reťazec krokov zvyčajne zvládnu pod minútu, čo výrazne skracuje čas medzi otázkou a hotovým, overiteľným výstupom.

Výkon a presnosť
- Externí hodnotitelia zaznamenali pri o3 o 20 % menej závažných chýb než pri o1 v náročných reálnych úlohách (poradenstvo, kreatívny dizajn, výskum). citeturn0view0
- o4‑mini zvláda vyššie hodnoty „messages per minute“ než o3, takže je vhodný pre aplikácie s veľkým objemom dotazov alebo tam, kde je kľúčová rýchla odozva pri nižších nákladoch.
Dostupnosť
Modely sú ihneď k dispozícii v rozhraní ChatGPT (verzie o3, o4‑mini a o4‑mini‑high) pre predplatiteľov Plus, Pro a Team; podpora o3‑pro má pribudnúť v najbližších týždňoch. Vývojári získajú prístup cez API.
Prečo na tom záleží
OpenAI týmto krokom naznačuje, že budúcnosť generatívnej AI spočíva v kombinácii robustného uvažovania, multimodality a autonómneho používania nástrojov. Vo výsledku môžu modely plniť zložité úlohy – od tvorby dátových analýz až po návrh softvéru – s minimálnym dohľadom človeka.
Podľa vyjadrení firmy ide zároveň o ďalší dôkaz, že „viac výpočtu = lepší výkon“ platí nielen pri predtrénovaní modelov, ale aj pri ich posilňovacom učení (RL).
Čo bude nasledovať?
OpenAI avizuje rozšírenie agentických schopností a ďalšie zvyšovanie limitov pre štandardné plány. Ak sa o3 a o4‑mini osvedčia, môžeme očakávať, že sa plný toolbox stane novým štandardom aj pre budúce generácie modelov.
Zdroj: Zdroj 1
Zanechajte komentár