Keď bol ChatGPT spustený, fungoval výhradne na báze textu. Neskôr pridaný hlasový režim pôsobil skôr ako samostatná funkcia – používateľ si musel vybrať, či chce písať, alebo hovoriť. To bolo často frustrujúce, najmä ak ste chceli hlasom požiadať o vygenerovanie obrázka, čo si vyžadovalo návrat k textu.
Najnovšia aktualizácia túto bariéru rúca. Funkcia ChatGPT Voice je teraz dostupná priamo v chate. Môžete rozprávať, sledovať odpovede, ako sa objavujú na obrazovke, a prezerať si mapy či vizuály bez prerušenia konverzácie. Hoci systém má ešte svoje „muchy“ (občas tvrdí, že zobrazil mapu, hoci sa tak nestalo), ukazuje jasný smer vývoja.
Výzva pre Apple a novú Siri
Zatiaľ čo OpenAI integruje hlas do textového prostredia, Apple k tomu pristupuje z opačného konca. Siri začínala ako čisto hlasová služba a prostredníctvom Apple Intelligence sa teraz učí pracovať s textom a kontextom na obrazovke (napríklad sumarizácia e-mailov).
Aby nová Siri splnila sľuby, musí fungovať presne ako aktualizovaný ChatGPT – musí byť multimodálna. Nestačí len odpovedať hlasom; musí vedieť manipulovať s textom a obrázkami na základe hovoreného príkazu.
Siri ako inteligentný agent
Budúcnosť asistentov nespočíva len v konverzácii, ale v akciách. Siri bude musieť fungovať ako inteligentný agent, ktorý ovláda nainštalované aplikácie.
Príkladom je príkaz: „Zarezervuj prvý zajtrajší let z Londýna do Las Vegas.“ Asistent musí pochopiť kontext a vykonať akciu cez príslušnú cestovnú aplikáciu.
Bude technológia vlastná alebo požičaná?
Je otázne, či Apple dokáže dobehnúť náskok chatbotov vlastnými silami včas. Je pravdepodobné, že pre pokročilé funkcie AI siahne po spolupráci s firmami ako OpenAI alebo Google.
Pre koncového používateľa pritom nie je podstatné, či technológia pod kapotou patrí Applu. Dôležité sú dve veci:
- Ochrana súkromia: Apple musí garantovať, že dáta odoslané partnerom (ako pri súčasnej integrácii ChatGPT) nebudú použité na tréning modelov.
- Rýchlosť nasadenia: Budúci rok je hraničným termínom. Ak to znamená použitie upraveného modelu Gemini alebo GPT-4o integrovaného do Siri, používatelia to pravdepodobne radi prijmú výmenou za funkčnosť.
