OpenAI opäť posúva hranice s modelom Sora 2, ktorý predstavuje prelomový posun pre video. Dokáže generovať fyzikálne presné scény, synchronizovaný zvuk a spúšťa ho v novej kreatívnej sociálnej aplikácii pre iOS.
Spoločnosť OpenAI dnes ohlásila vydanie Sora 2, svojej vlajkovej lode v oblasti generovania videa a zvuku. Zatiaľ čo pôvodný model Sora z februára 2024 bol prirovnávaný ku „GPT-3.5 momentu“ pre video, nová verzia mieri oveľa vyššie a prináša zásadné vylepšenia v oblasti realizmu, fyzikálnej presnosti a kontroly nad výsledným dielom.
Skok ku GPT-3.5 momentu pre video
Tím stojaci za vývojom Sory sa zameral na vytvorenie pokročilejších schopností simulácie sveta. Výsledkom je Sora 2, model, ktorý zvláda úlohy, ktoré boli pre predchádzajúce systémy extrémne náročné alebo priam nemožné. Príklady zahŕňajú komplexné gymnastické zostavy, backflip na paddleboarde s presným modelovaním dynamiky vztlaku a tuhosti, či dokonca krasokorčuliarsky trojitý axel s mačkou na hlave korčuliarky.
Kľúčovým rozdielom je fyzikálna vernosť. Staršie modely mali tendenciu „podvádzať“ a deformovať realitu, aby splnili požiadavku. Napríklad, ak basketbalista minul kôš, lopta sa mohla do obruče teleportovať. V Sora 2 sa lopta odrazí od dosky presne tak, ako by sa očakávalo. Model tak dokáže simulovať nielen úspech, ale aj zlyhanie, čo je pre akýkoľvek užitočný simulátor sveta kritická vlastnosť.
Nielen video: Synchronizovaný dialóg a zvukové efekty
Sora 2 je plnohodnotný generatívny systém pre video aj audio. Dokáže vytvárať sofistikované zvukové kulisy, realistickú reč a zvukové efekty, ktoré sú presne synchronizované s dianím na obrazovke. To otvára dvere k tvorbe komplexných filmových scén, kde dialógy postáv či zvuky prostredia zodpovedajú vizuálu s vysokou mierou presnosti.
Okrem toho model ponúka výrazne lepšiu ovládateľnosť, dokáže sledovať zložité inštrukcie naprieč viacerými zábermi a zároveň zachovávať konzistentnosť sveta a postáv. Vyniká v realistickom, filmovom aj anime štýle.
Nová aplikácia Sora a funkcia „Cameos“
Najväčšou novinkou pre používateľov je spustenie novej sociálnej aplikácie pre iOS s jednoduchým názvom „Sora“. Táto aplikácia nie je len nástrojom, ale aj platformou pre zdieľanie a remixovanie tvorby.
Jej kľúčovou funkciou je „Cameos“. Používateľ si môže v aplikácii nahrať krátke video a audio záznam na overenie identity a zachytenie svojej podoby a hlasu.
Následne ho model dokáže s pozoruhodnou vernosťou vložiť do akejkoľvek scény vygenerovanej Sorou. Táto funkcia je univerzálna a funguje pre akúkoľvek osobu, zviera alebo objekt. Predstavuje tak úplne nový spôsob komunikácie a kreatívneho vyjadrenia.
Dôraz na zodpovedné uvedenie
OpenAI si je vedomé rizík spojených so sociálnymi platformami, ako sú závislosť, izolácia či optimalizácia feedov na úkor duševného zdravia používateľov.
Preto prichádza s niekoľkými opatreniami:
- Kontrola nad feedom: Používatelia môžu pomocou prirodzeného jazyka ovplyvňovať odporúčací algoritmus a prispôsobiť si, aký obsah vidia.
- Priorita tvorby, nie spotreby: Aplikácia je navrhnutá tak, aby maximalizovala tvorbu a interakciu s priateľmi, nie bezcieľne scrollovanie.
- Ochrana tínedžerov: Pre mladistvých sú zavedené predvolené limity na počet videných videí a prísnejšie pravidlá pre používanie funkcie „Cameos“. K dispozícii sú aj rodičovské nástroje cez ChatGPT.
- Kontrola nad vlastnou podobou: Používateľ má plnú kontrolu nad svojím „cameom“. Môže kedykoľvek odvolať prístup alebo odstrániť akékoľvek video, ktoré ho obsahuje.
- Transparentná monetizácia: OpenAI zatiaľ neplánuje monetizáciu založenú na reklame. Jediným zvažovaným modelom je možnosť priplatiť si za extra generovanie v prípade vysokého dopytu.
Dostupnosť a čo ďalej?
Aplikácia Sora pre iOS je už k dispozícii na stiahnutie. Prístup sa bude uvoľňovať postupne na základe pozvánok, pričom prvé vlny sú určené pre používateľov v USA a Kanade s plánom rýchlej expanzie do ďalších krajín.
Sora 2 bude spočiatku k dispozícii zadarmo s veľkorysými limitmi. Používatelia ChatGPT Pro získajú prístup k experimentálnemu, vysokokvalitnému modelu Sora 2 Pro na webe sora.com. V budúcnosti sa plánuje aj sprístupnenie Sora 2 cez API.
Sora 2 je významným krokom k vytvoreniu univerzálnych simulátorov sveta, ktoré môžu urýchliť ľudský pokrok. Zároveň však OpenAI prináša túto technológiu do rúk bežných ľudí spôsobom, ktorý sľubuje novú éru zábavy, kreativity a spojenia.
Zdroj: Zdroj 1