Príliš nebezpečný na zverejnenie? Claude Mythos otvára debatu o ére obmedzeného prístupu k AI

Keď firma vyhlási, že jej model umelej inteligencie je príliš nebezpečný pre verejnosť, nejde len o firemné rozhodnutie. Môže to byť signál širšej zmeny v tom, ako sa budú najsilnejšie AI systémy vyvíjať, kontrolovať a sprístupňovať výskumníkom, firmám aj štátom.

Too dangerous to release: is Mythos the start of the restricted-AI era?

Zdroj: https://www.nature.com/articles/d41586-026-01617-2

Spoločnosť Anthropic v apríli oznámila, že vytvorila model Claude Mythos, ktorý podľa nej nie je bezpečné sprístupniť verejnosti. Firma so sídlom v San Franciscu uviedla, že model dokázal nájsť zraniteľnosti vo všetkých hlavných operačných systémoch a webových prehliadačoch, ktoré sa dnes používajú. V blogovom príspevku o projekte Project Glasswing, teda o obmedzenom sprístupnení modelu približne päťdesiatim dôveryhodným organizáciám, Anthropic napísal, že následky pre ekonomiku, verejnú bezpečnosť a národnú bezpečnosť by mohli byť vážne.

Podľa expertov môže ísť o začiatok trendu. Helen Toner z Center for Security and Emerging Technology pri Georgetown University očakáva, že nepôjde o jednorazový prípad, ale skôr o prvý z viacerých podobných krokov. Podobne to vidí aj výskumník bezpečnosti AI Vasilios Mavroudis z Alan Turing Institute. Len týždeň po oznámení Mythos nasledoval aj OpenAI, ktorý obmedzene sprístupnil kyberbezpečnostný model GPT-5.4-Cyber iba preverovaným výskumníkom a organizáciám.

Ak sa takýto režim rozšíri, znamenalo by to výrazný posun v dlhoročnej debate medzi „otvorenou“ a „uzavretou“ AI. Výskumníci roky tvrdili, že transparentnosť modelov prospieva nielen samotnému výskumu AI, ale aj vede všeobecne, pretože umožňuje algoritmy skúmať, overovať a rozvíjať. Teraz sa črtá možnosť, že tvorcovia najpokročilejších modelov ich nebudú vo veľkom zverejňovať vôbec.

Dôsledky by nemuseli zostať len pri rozhodnutiach súkromných firiem. Ak by vlády začali považovať najsilnejšie AI systémy za technológie s dvojitým použitím, teda využiteľné civilne aj vojensky, mohli by prísť dodatočné kontroly podobné tým, aké sa používajú pri technológiách relevantných pre obranu. Podľa Toner by to mohlo obmedziť okruh ľudí a inštitúcií, ktoré sa k najsilnejšiemu softvéru dostanú.

Nie je to prvý prípad obmedzeného vydania modelu, ale doterajšie precedensy boli slabšie. OpenAI napríklad vo februári 2019 zverejnil len zjednodušenú verziu GPT-2 s odvolaním sa na možné zneužitie a plný prístup umožnil až neskôr v tom istom roku. Vtedajší model však mal podľa dnešných meradiel veľmi obmedzené schopnosti a vedel len jednoducho dopĺňať vety.

Pri Claude Mythos je problém aj v tom, že výskumníci bez prístupu nedokážu nezávisle posúdiť, či sú obavy Anthropicu plne opodstatnené. Ciaran Martin z University of Oxford, bývalý šéf britského National Cyber Security Centre, však povedal, že Mythos pôsobí ako „veľká vec“ a ako rýchle zrýchlenie schopností AI.

AI laboratóriá už dnes používajú rôzne ochranné mechanizmy, ktoré majú zabrániť nebezpečnému používaniu modelov. Často ide o pravidlá alebo skryté inštrukcie, podľa ktorých má systém odmietať rizikové požiadavky. Takéto zábrany sa však dajú obísť takzvaným jailbreakingom. Práve preto môže byť podľa Mavroudisa problémom, ak by mali k podobnému nástroju rovnaký prístup všetci: obrancovia ho môžu využiť na hľadanie slabín v systémoch a softvéri, no to isté dokážu aj útočníci. Anthropic tak podľa tejto logiky dáva obrane určitý náskok.

Správa zároveň pripomína, že k určitému neautorizovanému prístupu k Mythos už vraj došlo. Anthropic uviedol, že jeho „konečným cieľom“ je umožniť používateľom bezpečne nasadzovať modely triedy Mythos vo veľkom meradle, no na otázku Nature, či to bude znamenať aj verejný prístup, firma neodpovedala.

Podobná nejasnosť platí aj pri OpenAI. Spoločnosť hovorí, že pri GPT-5.4-Cyber začínala s obmedzeným sprístupnením a rýchlo pridala aj GPT-5.5-Cyber. Neskôr uviedla produkt Daybreak zameraný na kyberbezpečnosť, postavený na týchto nástrojoch. Zatiaľ sú však modely Cyber dostupné len oprávneným používateľom. Hovorca OpenAI odkázal Nature na firemný blog, podľa ktorého zodpovedné rozširovanie prístupu vyžaduje väčšiu istotu o tom, kto model používa, na aké systémy cieli a či je daná práca autorizovaná. Firma zároveň uviedla, že časom očakáva širší prístup.

Obmedzenia sa netýkajú iba kyberbezpečnosti. Spoločnosti vyvíjajúce modely pre biologický výskum upozorňujú aj na riziko zneužitia pri tvorbe biologických zbraní. OpenAI v apríli predstavila GPT-Rosalind určený pre vedcov v oblasti biologických vied a uviedla, že ho bude sprístupňovať cez štruktúru „trusted-access“, teda iba schváleným používateľom. Firma bude zároveň sledovať, ako sa model používa. Minulý rok zas Google uviedol systém „AI co-scientist“, ku ktorému sa dostanú len výskumníci, ktorí o prístup požiadajú.

Ak by takéto obmedzenia pretrvali, mohlo by to znamenať, že k najvýkonnejším AI nástrojom sa dostanú najmä dobre prepojení výskumníci a organizácie. Obavy z nerovnosti už vo výskume existujú aj dnes, keďže rastúce ceny verejne dostupných AI systémov podľa niektorých vedcov zvýhodňujú tímy, ktoré si môžu dovoliť drahé predplatné.

To všetko robí z Claude Mythos viac než len jeden nový model. Stáva sa testom toho, či sa špičková AI začne správať skôr ako otvorený vedecký nástroj, alebo ako prísne strážená technológia s regulovaným prístupom.

Prečo je tento spor dôležitý pre vedu

Všeobecne platí, že moderná veda stojí na overiteľnosti, opakovateľnosti a možnosti nadväzovať na cudzie výsledky.

Práve preto má otvorenosť pri výskumných nástrojoch veľkú hodnotu. Ak však modely dosiahnu schopnosti, ktoré môžu výrazne uľahčiť zneužitie, vzniká napätie medzi vedeckou transparentnosťou a bezpečnostnou opatrnosťou. Prípad Mythos tento konflikt ukazuje v ostrej podobe: čím schopnejší je nástroj, tým ťažšie sa rozhoduje, komu má byť prístupný.

Čo znamená obmedzený prístup k modelu

Obmedzený prístup v tomto kontexte neznamená úplné utajenie, ale skôr režim, v ktorom model môžu používať len vybrané a preverované organizácie alebo výskumníci. Takýto prístup sa v technológiách objavuje vtedy, keď sa tvorcovia snažia získať kontrolu nad tým, kto nástroj používa, na aký účel a za akých podmienok. Zdroj opisuje, že pri niektorých modeloch sa firmy snažia používateľov schvaľovať a monitorovať, čo naznačuje posun od masovej dostupnosti k selektívnemu prístupu.

Prečo samotné bezpečnostné zábrany nemusia stačiť

Bežnou praxou pri AI je vkladanie pravidiel, ktoré majú model zastaviť pri nebezpečných požiadavkách. Ako však pripomína článok, takéto ochrany sa dajú obchádzať. Všeobecné pozadie je pritom známe aj z iných oblastí bezpečnosti: ak nástroj vie pomáhať pri hľadaní slabín, rozdiel medzi obranným a útočným použitím často nezávisí od technológie samotnej, ale od používateľa a jeho zámeru. Aj preto sa časť firiem prikláňa skôr k obmedzeniu prístupu než k spoliehaniu sa iba na technické poistky.

Riziko nerovnosti medzi výskumníkmi a inštitúciami

Ak budú najvýkonnejšie systémy dostupné len úzkemu okruhu schválených používateľov, môže sa prehĺbiť rozdiel medzi veľkými, dobre financovanými inštitúciami a menšími tímami. To je širší problém, ktorý sa netýka len jedného modelu. Už dnes sa diskutuje o tom, že vysoké náklady na pokročilé AI služby znevýhodňujú časť akademickej obce. Pri režime obmedzeného prístupu sa k finančnej bariére môže pridať aj bariéra reputačná, inštitucionálna alebo geopolitická.

Čo zostáva nejasné a čo môže nasledovať

Z dostupných informácií stále nie je jasné, či sa modely ako Claude Mythos alebo kyberbezpečnostné modely od OpenAI niekedy dostanú k širšej verejnosti. Neisté je aj to, ako by na tento trend reagovali vlády a regulačné úrady, ak by najsilnejšie AI systémy začali vnímať ako technológie s dvojitým použitím. Najbližšie obdobie tak pravdepodobne ukáže, či ide o ojedinelé preventívne opatrenia, alebo o začiatok novej normy, v ktorej bude prístup k najpokročilejšej AI podstatne prísnejšie kontrolovaný než doteraz.


Zdroj: Nature News

Pôvodný článok: https://www.nature.com/articles/d41586-026-01617-2


Môže sa Vám ešte páčiť...

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *