MicrosoftSoftwareSprávyUmelá inteligenciaVideáVýrobcovia
Dôležitý

Microsoft si verí: Všetko na internete môže využiť na tréning AI?

S príchodom nových služieb umelej inteligencie sa vynorila otázka práva na využívanie obsahu na tréning týchto služieb. Šéf AI v Microsofte má na to celkom jasný názor.

V nedávnom rozhovore pre americkú televíziu NBC News poskytol šéf vývoja AI v Microsofte Mustafa Suleyman celkom jasný obraz toho, ako veľkí hráči ignorujú zákony a pravidlá pri tréningu svojich veľkých jazykových modelov. Nie je to však iba problém Microsoftu, ale aj ostatných veľkých a aj menších hráčov v oblasti umelej inteligencie. 

Prístupné = freeware?

Suleyman v rozhovore uviedol, že všetko čo je na internete dostupné zadarmo je vlastne freeware. Všetok takýto obsah potom môžu firmy použiť na tréning veľkých jazykových modelov. V podstate akýkoľvek autorský obsah, ktorý je na internete bezplatne dostupný teda môže napríklad Microsoft využiť na tréning AI. Aspoň takto to vníma Suleyman. A zrejme len on. Názor autor bude zrejme troch odlišný. 

Čiastočne má Suleyman pravdu, ale je potrebné sa pozrieť na akom webe alebo službe je takýto obsah dostupný. Pokiaľ napríklad zverejníte príspevok na sociálnej sieti a tento je verejne dostupný, tak ho môže firma využiť na tréning AI. Nejde o obsah chránený autorským právom a zákonmi. Všetko čo zverejňuje na sieťach, je totiž majetkom samotných prevádzkovateľov.

Napríklad údaje o technických parametroch zariadení nie sú chránené autorským právom, ale už článok o samotnom zariadení je autorským zákonom chránený. Takýto obsah nie je možné ďalej využívať k tomu vlastník práv nedá svoj súhlas. 

Nie všetko zadarmo je freeware

So Suleymanom by pravdepodobne nesúhlasili aj vydavatelia, ktorí prevádzkujú spravodajské weby. Problém s jeho tvrdením by mali zrejme aj tvorcovia a umelci. Aj keď obsah zadarmo má svojho autora a ten má právo na ochranu svojho autorského diela. Takýto obsah je majetkom danej osoby a to aj v prípade ak za prístup k nemu nepýta žiadny poplatok. 

“Myslím si, že pokiaľ ide o obsah, ktorý sa už nachádza na otvorenom webe, spoločenská zmluva tohto obsahu od 90. rokov bola taká, že ide o fair use. Ktokoľvek ho môže kopírovať, znovu s ním vytvárať Ďalší obsah, reprodukovať ho. To bol „freeware“, ak chcete, takto to bolo chápané,”

uviedol v rozhovore pre NBC News Mustafa Suleyman.

Je naivné si myslieť, že všetko čo je na internete dostupné bezplatne môže Microsoft alebo iná firma využiť na tréning umelej inteligencie. Takto svet nefunguje, možno iba v očiach Microsoftu. Bezplatný obsah má svojho autora a to, že je zadarmo nič nemení na jeho právach.

Platené = šedá zóna?

Ešte zaujímavejšie je ako sa Suleyman vyjadril k platenému obsahu, ktorý si napríklad vydavatelia chránia zamykaním. Podľa Suleymana ide o “šedú zónu” a aj takýto obsah by teda bolo možné použiť napríklad na tréning umelej inteligencie. 

Takéto tvrdenie je však už absolútne za hranou normálnosti. Pokiaľ vydavateľ zamkne obsah a zamedzí tak prístup k takémuto obsahu, tak rozhodne nejde o šedú zónu. Vydavatelia takto financujú chod portálov a zároveň ide väčšinou o prémiový obsah. 

“Existuje samostatná kategória, v ktorej webová stránka, vydavateľ alebo spravodajská organizácia výslovne povedali, že neprehľadávajte ma z iného dôvodu, než je indexovanie, aby tento obsah mohli nájsť iní ľudia. To je šedá zóna a myslím, že táto oblasť prejde súdnou cestou,”

doplnil Mustafa Suleyma.

Využívať takýto obsah na tréning umelej inteligencie navyše často zakazujú aj podmienky používania samotných prevádzkovateľov a vydavateľov. Microsoft tiež nedáva prístup ku svojim produktom pre všetkých a nemôžu ich využívať všetci, ale len predplatitelia po prihlásení sa do svojho účtu. 

Nie len Microsoft

Tvrdenia Suleymana vyvolali na sociálnych sieťach vlnu kritiky, keďže sa netýkajú len veľkých vydavateľov. Na internete svoj obsah publikuje množstvo ľudí a síce bezplatne, ale obsah má svojho majiteľa. Ten by mal dať výslovný súhlas s využitím jeho obsahu treťou stranou. 

Problémom umelej inteligencie je navyše aj to, že ako raz nejaký obsah na trénovanie jazykového modelu použije, tak už ho z neho nikto nedokáže dostať preč. Takže použitý obsah sa takpovediac naveky stane súčasťou jazykového modelu. Ak by neskôr súd rozhodol, že takýto obsah bol na trénovanie umelej inteligencie využívaný v rozpore zo zákonom, musel by prevádzkovateľ znovu vytrénovať jazykový model už bez tohto sporného obsahu. 

Problém so svojským prístupom k trénovaniu jazykových modelov a získavaniu informácií však nemá len Microsoft, ale aj ďalšie firmy pôsobiace v oblasti AI. Napríklad OpenAI použilo na trénovanie ChatGPT aj videá na YouTube a to napriek tomu, že to podmienky platformy zakazujú. 

Meta nedávno oznámila, že údaje užívateľov Facebooku a Instragramu použije na trénovanie jazykového modelu a to vrátane príspevkov. Užívateľom v Európskej únii Meta umožnila podať o žiadosť o nevyužívanie ich dát na trénovanie umelej inteligencie. Pôvodne Meta ako hraničný termín uvádzala 26. júna, ale žiadosť sa dá stále podať

Schválená regulácia v EÚ

Trh s umelou inteligenciou je skutočne divoký a prakticky bez regulácie. Veľkí technologickí hráči sa zamerali na rozširovanie umelej inteligencie. Naposledy to bol napríklad Apple, ktorý predstavil  vlastnú umelú inteligenciu Apple Intelligence. Tá sa nakoniec pre obavy z možných postihov zo strany Európskej komisie v EÚ zatiaľ neobjaví.

EÚ má zároveň od marca tohto roka schválený akt o umelej inteligencii, ktorý upravuje používanie umelej inteligencie. Lenže kým začne platiť, tak ubehnú ešte dva roky. Navyše členské štáty majú často problém s včasným implementovaním nových európskych pravidiel do vlastných legislatív. 

Bujaré využívanie verejne prístupných textov, obrázkov a videí na trénovanie umelej inteligencie môžu zatrhnúť až súdy. Navyše prebieha niekoľko súdnych sporov vydavateľov, umelcov a ďalších tvorcov obsahu s firmami ako OpenAI, kde sa domáhajú svojich práv. Aby aj firmy ako OpenAI platili za využívanie dát (aj keď sú verejne prístupné) alebo aby ich prestali využívať. 

V každom prípade to firmy ako Microsoft, Meta alebo OpenAI robia z pozície moci a zatiaľ im to prechádza. Ak by súdy rozhodli, že takéto konanie je v rozpore so zákonmi platnými v niektorých krajinách, tak môže prísť k zmene. Lenže zatiaľ žiadny súd v prípade žalôb podaných tvorcami na firmy pôsobiace v oblasti AI definitívne nerozhodol. 

Zdroj
theverge.com

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *

Back to top button