Ai on The Engine Room

Ai on The Engine Room/tags/ai/Recent content in Ai on The Engine RoomHugo -- 0.155.3ru-ruTue, 26 May 2026 12:00:00 +0300AI Cybersecurity Careers 2026/notes/ai_cybersecurity_careers_2026/Tue, 26 May 2026 12:00:00 +0300/notes/ai_cybersecurity_careers_2026/Карьерный обзор рынка AI Security на 2026 годAI Security/notes/ai_security_-courses/Thu, 16 Apr 2026 15:00:00 +0300/notes/ai_security_-courses/Курсы и сертификация по AI SecurityMCPThreatHive: Automated Threat Intelligence for MCP Ecosystems/notes/mcpthreathive/Thu, 16 Apr 2026 00:00:00 +0300/notes/mcpthreathive/Платформа поиска угроз в Model Context ProtocolRLSpoofer: Легковесный инструмент для оценки устойчивости к подделке водяных знаков/notes/rlspoofer/Tue, 14 Apr 2026 15:00:00 +0300/notes/rlspoofer/Атака на водяные знаки как способ подделки подлинностиDeepSight/notes/deepsight/Sun, 15 Feb 2026 15:00:00 +0300/notes/deepsight/Переход от черного ящика к прозрачной диагностике безопасности ИИТехнологические прогнозы на 2026 год от IEEE/notes/ieee_tech_predictions_2026/Mon, 02 Feb 2026 15:00:00 +0300/notes/ieee_tech_predictions_2026/IEEE выкатила отчет, а там что называется «от патрона до…» дальше сами знаете. Документ посвящен анализу ключевых технологических трендов в 2026OpenRT - открытый фреймворк для red teaming'а мультимодальных LLM/notes/open_rt/Tue, 23 Dec 2025 15:00:00 +0300/notes/open_rt/OpenRT — модульная и расширяемая среда для систематической оценки безопасности больших языковых моделейМалые языковые модели/notes/slm/Mon, 15 Dec 2025 15:00:00 +0300/notes/slm/Заметка к документу Small Language Model for AI Agents HandBookDoublespeak/notes/doublespeak/Wed, 10 Dec 2025 15:00:00 +0300/notes/doublespeak/Авторы представляют новую атаку Doublespeak — простую и основанную на «захвате» внутренних представлений модели в контекстеFineSec/notes/finesec/Sat, 06 Dec 2025 15:00:00 +0300/notes/finesec/Новый фреймворк для создания компактных моделей для поиска уязвимостей в коде на C/C++Whisper Leak/notes/whisper_leak/Thu, 04 Dec 2025 15:00:00 +0300/notes/whisper_leak/Новая атака, которая позволяет определить тему запроса к LLM, по зашифрованному трафикуBreaking Agent Backbones/notes/breaking_agent_backbones/Tue, 02 Dec 2025 15:00:00 +0300/notes/breaking_agent_backbones/Как выбор LLM влияет на безопасность агентаLOTL атаки с использованием локальных LLM/notes/lotl_attack_with_llm/Sun, 30 Nov 2025 15:00:00 +0300/notes/lotl_attack_with_llm/Как будущие устройства со встроенными LLM станут проблемой безопасности, так как злоумышленники смогут “жить за счёт LLM” (Living Off the LLM, LOLLM)Architecting secure enterprise AI agents with MCP/notes/architecting_secure_enterprise/Tue, 25 Nov 2025 15:00:00 +0300/notes/architecting_secure_enterprise/Руководство по проектированию безопасных корпоративных ИИ-агентов с использованием MCP от IBM c верификацией от AnthropicЗащита MLLM от неявных jailbreak атак/notes/defence_mllm_from_jailbreak/Sat, 22 Nov 2025 15:00:00 +0300/notes/defence_mllm_from_jailbreak/Новый класс атак, когда отдельно текст и изображение выглядят безопасно, но их совместное сочетание несёт злонамеренный смыслPruning-Activated Attack/notes/pruning_activated_attack/Mon, 17 Nov 2025 15:00:00 +0300/notes/pruning_activated_attack/Pruning модели может быть использован злоумышленникомExternal Data Extraction Attacks against RAG/notes/data_extraction_attacks_against_rag/Fri, 14 Nov 2025 15:00:00 +0300/notes/data_extraction_attacks_against_rag/В работе исследован новый класс атак на системы типа RAGFine-Tuning Jailbreaks/notes/fine_tuning_jailbreaks/Mon, 10 Nov 2025 15:00:00 +0300/notes/fine_tuning_jailbreaks/Статья рассказывает об уязвимости систем тонкой настройки больших языковых моделей в условиях, максимально приближённых к реальной эксплуатацииTool Tweak/notes/tool_tweak/Thu, 06 Nov 2025 15:00:00 +0300/notes/tool_tweak/Атака на выбор инструментов в агентных системахFuncPoison - отравленная библиотека/notes/func_poison/Mon, 03 Nov 2025 15:00:00 +0300/notes/func_poison/Новая атака, основанная на отравлении библиотеки функций, которая позволяет подменять поведение агентов без изменения их моделейЗащита MLLM от неявных jailbreak атак/notes/red_teaming_llm_with_mcp/Thu, 30 Oct 2025 15:00:00 +0300/notes/red_teaming_llm_with_mcp/MCP - критическая и уязвимая точка в цепочке доверия LLM-агентовFuzzingBrain/notes/fuzzingbrain/Thu, 23 Oct 2025 15:00:00 +0300/notes/fuzzingbrain/Всё что нужно - это фаззинг…Shell or Nothing/notes/shell_or_nothing/Sun, 19 Oct 2025 15:00:00 +0300/notes/shell_or_nothing/Статья о фреймворке на базе LLM и его результатах получения доступа к shellБитовая инверсия как атака на LLM/notes/bit_flip_attacks/Fri, 17 Oct 2025 15:00:00 +0300/notes/bit_flip_attacks/Статья описывает проблему малоизученных аппаратных атак на LLM - битовых инверсий (Bit-Flip Attacks, BFA)Cuckoo Attack/notes/cuckoo_attack/Wed, 15 Oct 2025 15:00:00 +0300/notes/cuckoo_attack/Разбор новой атаки на IDE с LLM-агентами: как ИИ-помощники могут стать инструментом для скрытного закрепления злоумышленника в системе.Многоагентный pipeline для защиты LLM от prompt injection/notes/multiagent_pipeline/Wed, 15 Oct 2025 15:00:00 +0300/notes/multiagent_pipeline/Разбор архитектуры многоагентной защиты, которая позволяет снизить успешность атак типа prompt injection за счет разделения ролей между агентами.