← Zpět na komunitu
Další

GPT-5.5 dorovnává Mythos Preview v nových kyberbezpečnostních testech

Nezávislí výzkumníci zjistili, že GPT-5.5 dosahuje srovnatelných nebo lepších výsledků než vysoce propagovaný Mythos Preview v úlohách zaměřených na kybernetickou bezpečnost.

GPT-5.5 dorovnává Mythos Preview v nových kyberbezpečnostních testech

V nedávné době se v technologickém světě intenzivně diskutovalo o modelu Mythos Preview, který byl prezentován jako významný posun v oblasti ofenzivních kybernetických kapacit umělé inteligence. Marketingová komunikace kolem Mythosu naznačovala, že se jedná o průlom s potenciálem zásadně ovlivnit dynamiku kybernetické bezpečnosti. Tyto zprávy vyvolaly debatu o etických aspektech a potenciálním zneužití takových technologií.

Nezávislí výzkumníci však nyní přinášejí data, která tento narativ relativizují. Ve studii, jejíž výsledky byly publikovány mimo jiné na Ars Technica, porovnali výkon modelu GPT-5.5 s Mythos Preview na sadě úloh zaměřených na kybernetickou bezpečnost. Tyto úlohy zahrnovaly scénáře typu „capture-the-flag“ a úkoly spojené s exploatací zranitelností, které testují schopnost AI identifikovat a využívat slabá místa v systémech. Výsledky ukázaly, že GPT-5.5 dosahuje srovnatelných, nebo dokonce lepších výsledků než Mythos Preview.

Přehodnocení kapacit a metodiky hodnocení

Zjištění nezávislých výzkumníků má několik klíčových dopadů. Předně, tlumí prvotní vlnu paniky, která se šířila v souvislosti s údajnými bezprecedentními schopnostmi Mythos Preview. Ukazuje se, že pokrok v oblasti generativní AI je rychlý a konkurenční prostředí zajišťuje, že podobné kapacity se mohou objevit u více modelů v krátkém časovém horizontu. V tomto případě se dorovnání výkonu odehrálo během několika týdnů.

Studie zároveň znovu otevírá otázku metodiky hodnocení AI modelů, zejména těch s potenciálem duálního použití. Pokud se marketingová tvrzení o jedinečnosti a průlomovosti rychle ukáží jako přehnaná ve světle nezávislého testování, je nutné kriticky přistupovat k tomu, jak jsou nové schopnosti AI prezentovány a jak jsou jejich rizika posuzována. Debata by se měla soustředit spíše na robustní a transparentní evaluační rámce než na marketingově řízené narativy.

Tento vývoj také zpochybňuje smysl takzvaného „gating capabilities“, tedy umělého omezování přístupu k určitým funkcím AI modelů s odůvodněním, že jsou příliš nebezpečné. Pokud konkurence dokáže během krátké doby vyvinout a uvést na trh modely se srovnatelnými schopnostmi, pak snahy o globální regulaci či omezení přístupu k těmto technologiím mohou být neefektivní a pouze zpomalovat vývoj v regulovaných oblastech, zatímco v jiných se bude pokračovat bez omezení.

Co to znamená pro vaši firmu

Zdroj Ars Technica →