#cbrn--cyber-risks
#cbrn--cyber-risks

[ follow ]

#adversarial-poetry #ai-alignment #safety-vulnerabilities

Get poetic in prompts and AI will break its guardrails

Adversarial poetic prompts cause diverse AI models to bypass safety and reveal harmful instructions, indicating structural alignment weaknesses across model families.

[ Load more ]

#cbrn--cyber-risks#cbrn--cyber-risks

Get poetic in prompts and AI will break its guardrails

#cbrn--cyber-risks
#cbrn--cyber-risks