<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Jailbreak on The Engine Room</title><link>/tags/jailbreak/</link><description>Recent content in Jailbreak on The Engine Room</description><generator>Hugo -- 0.155.3</generator><language>ru-ru</language><lastBuildDate>Sat, 22 Nov 2025 15:00:00 +0300</lastBuildDate><atom:link href="/tags/jailbreak/index.xml" rel="self" type="application/rss+xml"/><item><title>Защита MLLM от неявных jailbreak атак</title><link>/notes/defence_mllm_from_jailbreak/</link><pubDate>Sat, 22 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/defence_mllm_from_jailbreak/</guid><description>Новый класс атак, когда отдельно текст и изображение выглядят безопасно, но их совместное сочетание несёт злонамеренный смысл</description></item><item><title>External Data Extraction Attacks against RAG</title><link>/notes/data_extraction_attacks_against_rag/</link><pubDate>Fri, 14 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/data_extraction_attacks_against_rag/</guid><description>В работе исследован новый класс атак на системы типа RAG</description></item><item><title>Fine-Tuning Jailbreaks</title><link>/notes/fine_tuning_jailbreaks/</link><pubDate>Mon, 10 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/fine_tuning_jailbreaks/</guid><description>Статья рассказывает об уязвимости систем тонкой настройки больших языковых моделей в условиях, максимально приближённых к реальной эксплуатации</description></item></channel></rss>