Jailbreak on The Engine Room

Jailbreak on The Engine Room/en/tags/jailbreak/Recent content in Jailbreak on The Engine RoomHugo -- 0.155.3en-usSat, 22 Nov 2025 15:00:00 +0300Defending MLLMs from Implicit Jailbreak Attacks/en/notes/defence_mllm_from_jailbreak/Sat, 22 Nov 2025 15:00:00 +0300/en/notes/defence_mllm_from_jailbreak/A new class of attacks where text and image look safe separately, but their combination carries malicious meaningExternal Data Extraction Attacks against RAG/en/notes/data_extraction_attacks_against_rag/Fri, 14 Nov 2025 15:00:00 +0300/en/notes/data_extraction_attacks_against_rag/The paper studies a new class of attacks against RAG-type systemsFine-Tuning Jailbreaks/en/notes/fine_tuning_jailbreaks/Mon, 10 Nov 2025 15:00:00 +0300/en/notes/fine_tuning_jailbreaks/The paper discusses vulnerabilities in fine-tuning systems for large language models under conditions close to real-world operation