Whisper Leak
Новая атака, которая позволяет определить тему запроса к LLM, по зашифрованному трафику
Новая атака, которая позволяет определить тему запроса к LLM, по зашифрованному трафику
Как выбор LLM влияет на безопасность агента
Как будущие устройства со встроенными LLM станут проблемой безопасности, так как злоумышленники смогут “жить за счёт LLM” (Living Off the LLM, LOLLM)
Руководство по проектированию безопасных корпоративных ИИ-агентов с использованием MCP от IBM c верификацией от Anthropic
Новый класс атак, когда отдельно текст и изображение выглядят безопасно, но их совместное сочетание несёт злонамеренный смысл
Pruning модели может быть использован злоумышленником
В работе исследован новый класс атак на системы типа RAG
Статья рассказывает об уязвимости систем тонкой настройки больших языковых моделей в условиях, максимально приближённых к реальной эксплуатации
Атака на выбор инструментов в агентных системах
Новая атака, основанная на отравлении библиотеки функций, которая позволяет подменять поведение агентов без изменения их моделей