Sumarizované TechBotom
- Nový model GPT-Image-1.5 prináša štvornásobné zrýchlenie a lepšiu konzistenciu pri úprave existujúcich fotografií.
- Vylepšené vykresľovanie textu a markdownu umožňuje tvorbu komplexných infografík a presných mriežok priamo v chate.
- Vývojári môžu publikovať vlastné aplikácie v novom adresári, pričom OpenAI sľubuje budúce možnosti monetizácie.
Spoločnosť OpenAI dnes oznámila vydanie novej verzie svojho nástroja na generovanie obrázkov ChatGPT Images, ktorý je poháňaný modelom označeným ako GPT-Image-1.5. Aktualizácia je dostupná pre všetkých používateľov a prináša zásadné zmeny v spôsobe, akým model manipuluje s obrazom, spolu s novým systémom pre integráciu aplikácií tretích strán. Je to reakcia na nový model od Google Nano Banana Pro.
GPT-Image-1.5: Rýchlosť a konzistentné úpravy
Hlavnou technickou novinkou modelu GPT-Image-1.5 je schopnosť cielených úprav. Doterajšie modely pri požiadavke na zmenu detailu často prekreslili celý obrázok, čím sa stratila pôvodná kompozícia. Nový model dokáže meniť, pridávať alebo odoberať špecifické prvky (napríklad zmeniť oblečenie postavy alebo pridať objekt do pozadia), pričom zachováva identitu osôb, osvetlenie a celkový štýl pôvodného výstupu.
OpenAI uvádza, že generovanie obrázkov je teraz až štyrikrát rýchlejšie. Okrem textových príkazov zavádza platforma aj nové rozhranie Images v bočnom paneli. To ponúka prednastavené filtre a štýly pre používateľov, ktorí nechcú písať komplexné prompty od nuly. Funkcia tiež umožňuje nahrať referenčnú fotografiu pre zachovanie podoby tváre pri ďalšom generovaní.
Lepšia práca s textom a komplexnými príkazmi
Významným posunom prešlo vykresľovanie textu priamo v obrázkoch. Model lepšie zvláda hustejší text a menšie fonty, čo otvára možnosti pre tvorbu plagátov, obalov kníh či marketingových materiálov.
Zlepšila sa aj schopnosť modelu dodržiavať presné inštrukcie pri zložitých kompozíciách. Pri testoch model úspešne vykreslil mriežku 6×6 s konkrétnymi objektmi na presných pozíciách, čo bolo pre predchádzajúce verzie problematické. Súčasťou aktualizácie je aj podpora pre vykresľovanie formátovaného textu (markdown), čo umožňuje generovať vizuálne usporiadané infografiky alebo novinové články priamo ako obrázok.
Novinky pre API a biznis využitie
Model gpt-image-1.5 je okamžite dostupný aj cez API. OpenAI cieli na firemnú klientelu znížením ceny – vstupy aj výstupy obrázkov sú o 20 % lacnejšie v porovnaní s predchádzajúcou verziou GPT Image 1.
Vylepšená konzistencia log a vizuálnych prvkov má uľahčiť prácu marketingovým tímom a e-shopom. Spoločnosti ako Wix či Canva už nový model integrovali do svojich pracovných postupov, pričom vyzdvihujú najmä spoľahlivejšie dodržiavanie zadania (instruction following).
Otvorenie platformy pre vývojárov aplikácií
Okrem vizuálnych vylepšení OpenAI spúšťa možnosť pre vývojárov publikovať vlastné aplikácie priamo v ChatGPT. Vzniká tak nový „Adresár aplikácií“ (App Directory), kde môžu používatelia vyhľadávať nástroje, ktoré rozširujú funkčnosť chatu – od objednávania tovaru až po komplexnú prácu s dátami.
Vývojári môžu využívať Apps SDK na tvorbu natívnych četových rozhraní. V aktuálnej fáze je monetizácia možná prostredníctvom prepojenia na externé weby pre predaj fyzických produktov. Predaj digitálneho obsahu priamo cez platformu zatiaľ nie je podporovaný, no OpenAI plánuje túto možnosť v budúcnosti preskúmať.
Súčasťou spustenia sú prísne pravidlá pre ochranu súkromia. Aplikácie môžu žiadať len nevyhnutné dáta a používateľ má k dispozícii prehľad o tom, čo s aplikáciou zdieľa. Pri odpojení aplikácie stráca nástroj okamžite prístup k histórii konverzácií.