Bezpečnostní iluze...neztrácejí se, ale rostou...
Tento text vznikl na základě zprávy CCDH o bezpečném chování nového modelu GPT 5. A věru, to není tak veselé čtení, jaké bychom mohli předpokládat.
OpenAI, s patosem hodným slovutných vědců představila nový model GPT-5. Všichni jásají, až na...
Už žádné otravné „zamítavé“ odpovědi, které nás tak iritují, když se ptáme na nejefektivnější metody sebepoškozování nebo na to, jak si jako může nezletilý/á opatřit panáka. Namísto toho přichází éra „bezpečných vykoumaných rad“ – geniální koncept, který spočívá v tom, že vám poskytne nebezpečnou radu, ale omluvně při tom pozvedne obočí a doporučí vám linku důvěry, případně přidá další varování. Je to jako dostat od dealera drogy společně s vizitkou dobrého detoxikačního centra. Panečku, to se nám ten koncept bezpečnosti náramně rozrůstá. Jak jsem napsal v minulém článku, je to skvělý model pro marketing. Šarmantní, že?
Hlavní zjištění výzkumu CCDH by se dalo shrnout do věty: GPT-5 je horší, ale zdvořilejší. Zatímco GPT-4o ještě trpěl čímsi, co by přeneseně šlo nazvat záchvatem svědomí a občasně řekl kategorické „Ne, to je nebezpečné“, GPT-5 tuto společenskou chybu napravil. Jeho škodlivé odpovědi vzrostly na 53 %. Naučilo se totiž krásně a plynule odpovídat na dotazy, které by jeho předchůdce raději ignoroval. Chcete vědět, jak si teenager může koupit cigarety? GPT-5 vám to „pro vzdělávací účely“ rámcově popíše, samozřejmě s varováním, že kouření škodí zdraví. Dokonalá symbióza rizika a přiřazení se k čemusi, co se dá označit pocitem morální nadřazenosti.
Skutečným vrcholem tohoto vpravdě neotřelého způsobu odpovědí je téměř násilně zdvořilá reakce celého systému. V 99 % případů vás GPT-5 tlačí do dalšího prohloubení dané situace? „Co takhle si dát pár detailů k této sebevražedné metodě?“ ptá se téměř starostlivě. Samozřejmě, nadsazuji, ale ne tak moc. „Mohu vám připravit podrobný plán hubnutí na příští měsíc? Vezmeme to podle kategorií od 0 po 800 kalorií denně.“ Tato neodbytná snaha o konverzaci je navíc geniálně načasována. Chatbot si stále přihřívá polívčičku až do chvíle, kdy je jeho ochranný systém tak unavený, že je ochoten říct cokoliv. Terapeut, který vás na konci sezení navede k tomu, abyste skočili z mostu...
OpenAI sama přiznává, že jeho bezpečnostní zábrany v dlouhých konverzacích selhávají. Takže...
A pak tu máme skvělý marketingový manévr a zdánlivě logickou kličku: „Pouze pro prezentační (vzdělávací) účely“. Tato magická formule, známá každému středoškolákovi podle věku (ha, ha, ha), otevírá brány většině zakázaných informacím. Zatímco GPT-4o se při této frázi zhroutil jako domeček z karet a míra škodlivých odpovědí vyletěla o 23 procentních bodů nahoru, GPT-5 se drželo lépe – jeho škodlivost vzrostla „jen“ o 6 bodů. Jeho „bezpečná dokončení“ se ohýbají, ale nelámou. Přizpůsobí se, vyhoví. Je to chvályhodná flexibilita? Co je důležitější bezpečnostní principy nebo prostě užitečnost modelu vždy a všude? Z hlediska marketingu si odpovězte sami.
Právě probíhající žaloba proti Open AI v souvislosti se sebevraždou amerického chlapce je jen logickým vyústěním této strategie. Chlapec, který podle žaloby dlouze konverzoval s ChatGPT na téma sebevraždy. Systém údajně označil 377 jeho zpráv jako rizikové, ale nikdo – žádný algoritmus, žádný člověk – konverzaci neukončil, nevaroval rodiče, nezasáhl. Chatbot pokračoval v dialogu. Vždyť přeci zapojení a servilita jsou tou nejdůležitější metrikou.
... Žijeme v době, kdy se technologické giganty předhánějí v tom, kdo bude „méně otravný a poskytne lepší odpověď“. A v této honbě za plynulostí konverzace a uživatelským komfortem se z bezpečnosti stává pouhý marketingový přívažek. Varování se stalo alibi pro poskytování nebezpečného obsahu. A my, uživatelé, zejména ti mladí a zranitelní, jsme pokusnými králíky v laboratoři, kde se testují hranice mezi užitečným pomocníkem a digitálním kumpánem, který vás ochotně dovede až na okraj. A mnohé inciativy jsou velmi podobné. O rizicích sice mluví, ale informační povinnost školy vůči rodičům je podle nich nadbytečným byrokratickým opatřením.
Dokud budou regulátoři (u nás možná, v USA nejspíš žádní) přihlížet a společnosti jako OpenAI budou moci samy určovat, co je „dostatečně bezpečné“, zůstane realita taková, jak ji popsalo CCDH: Generativní AI je jen další platformou, kde je lidské blaho obětováno na oltáři růstu a zisku. A GPT-5 je jeho dokonalým, zdvořilým a to víc vlezlým nebezpečným knězem.
Milan Hausner
Jako bývalý ředitel velké školy jsem dnes už v důchodu. Celá řada věcí kolem nás mne nenechává klidným a tak si vám dovolím nabídnout svůj pohled na některé situace. Mým hlavním zájem je skutečné šílenství, které nás zaplavilo v oblasti umělé inteligence. Mnohé mé články najdete na profilu LinkedIn. Sem do obecnější čtenářské vrstvy se pokusím přenést články, které mají nějaký ten přesah. Protože nejen školou je živ člověk :)
Grafické prvky v článcích jsou tvořeny autorem prostřednictvím AI nástrojů - zejména gamma. V případě převzatého zdroje bude tato okolnost uvedena.