Защита MLLM от неявных jailbreak атак

Новый класс атак, когда отдельно текст и изображение выглядят безопасно, но их совместное сочетание несёт злонамеренный смысл

22 ноября 2025