<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Ai on The Engine Room</title><link>/tags/ai/</link><description>Recent content in Ai on The Engine Room</description><generator>Hugo -- 0.155.3</generator><language>ru-ru</language><lastBuildDate>Tue, 26 May 2026 12:00:00 +0300</lastBuildDate><atom:link href="/tags/ai/index.xml" rel="self" type="application/rss+xml"/><item><title>AI Cybersecurity Careers 2026</title><link>/notes/ai_cybersecurity_careers_2026/</link><pubDate>Tue, 26 May 2026 12:00:00 +0300</pubDate><guid>/notes/ai_cybersecurity_careers_2026/</guid><description>Карьерный обзор рынка AI Security на 2026 год</description></item><item><title>AI Security</title><link>/notes/ai_security_-courses/</link><pubDate>Thu, 16 Apr 2026 15:00:00 +0300</pubDate><guid>/notes/ai_security_-courses/</guid><description>Курсы и сертификация по AI Security</description></item><item><title>MCPThreatHive: Automated Threat Intelligence for MCP Ecosystems</title><link>/notes/mcpthreathive/</link><pubDate>Thu, 16 Apr 2026 00:00:00 +0300</pubDate><guid>/notes/mcpthreathive/</guid><description>Платформа поиска угроз в Model Context Protocol</description></item><item><title>RLSpoofer: Легковесный инструмент для оценки устойчивости к подделке водяных знаков</title><link>/notes/rlspoofer/</link><pubDate>Tue, 14 Apr 2026 15:00:00 +0300</pubDate><guid>/notes/rlspoofer/</guid><description>Атака на водяные знаки как способ подделки подлинности</description></item><item><title>DeepSight</title><link>/notes/deepsight/</link><pubDate>Sun, 15 Feb 2026 15:00:00 +0300</pubDate><guid>/notes/deepsight/</guid><description>Переход от черного ящика к прозрачной диагностике безопасности ИИ</description></item><item><title>Технологические прогнозы на 2026 год от IEEE</title><link>/notes/ieee_tech_predictions_2026/</link><pubDate>Mon, 02 Feb 2026 15:00:00 +0300</pubDate><guid>/notes/ieee_tech_predictions_2026/</guid><description>IEEE выкатила отчет, а там что называется «от патрона до…» дальше сами знаете. Документ посвящен анализу ключевых технологических трендов в 2026</description></item><item><title>OpenRT - открытый фреймворк для red teaming'а мультимодальных LLM</title><link>/notes/open_rt/</link><pubDate>Tue, 23 Dec 2025 15:00:00 +0300</pubDate><guid>/notes/open_rt/</guid><description>OpenRT — модульная и расширяемая среда для систематической оценки безопасности больших языковых моделей</description></item><item><title>Малые языковые модели</title><link>/notes/slm/</link><pubDate>Mon, 15 Dec 2025 15:00:00 +0300</pubDate><guid>/notes/slm/</guid><description>Заметка к документу Small Language Model for AI Agents HandBook</description></item><item><title>Doublespeak</title><link>/notes/doublespeak/</link><pubDate>Wed, 10 Dec 2025 15:00:00 +0300</pubDate><guid>/notes/doublespeak/</guid><description>Авторы представляют новую атаку Doublespeak — простую и основанную на «захвате» внутренних представлений модели в контексте</description></item><item><title>FineSec</title><link>/notes/finesec/</link><pubDate>Sat, 06 Dec 2025 15:00:00 +0300</pubDate><guid>/notes/finesec/</guid><description>Новый фреймворк для создания компактных моделей для поиска уязвимостей в коде на C/C++</description></item><item><title>Whisper Leak</title><link>/notes/whisper_leak/</link><pubDate>Thu, 04 Dec 2025 15:00:00 +0300</pubDate><guid>/notes/whisper_leak/</guid><description>Новая атака, которая позволяет определить тему запроса к LLM, по зашифрованному трафику</description></item><item><title>Breaking Agent Backbones</title><link>/notes/breaking_agent_backbones/</link><pubDate>Tue, 02 Dec 2025 15:00:00 +0300</pubDate><guid>/notes/breaking_agent_backbones/</guid><description>Как выбор LLM влияет на безопасность агента</description></item><item><title>LOTL атаки с использованием локальных LLM</title><link>/notes/lotl_attack_with_llm/</link><pubDate>Sun, 30 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/lotl_attack_with_llm/</guid><description>Как будущие устройства со встроенными LLM станут проблемой безопасности, так как злоумышленники смогут “жить за счёт LLM” (Living Off the LLM, LOLLM)</description></item><item><title>Architecting secure enterprise AI agents with MCP</title><link>/notes/architecting_secure_enterprise/</link><pubDate>Tue, 25 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/architecting_secure_enterprise/</guid><description>Руководство по проектированию безопасных корпоративных ИИ-агентов с использованием MCP от IBM c верификацией от Anthropic</description></item><item><title>Защита MLLM от неявных jailbreak атак</title><link>/notes/defence_mllm_from_jailbreak/</link><pubDate>Sat, 22 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/defence_mllm_from_jailbreak/</guid><description>Новый класс атак, когда отдельно текст и изображение выглядят безопасно, но их совместное сочетание несёт злонамеренный смысл</description></item><item><title>Pruning-Activated Attack</title><link>/notes/pruning_activated_attack/</link><pubDate>Mon, 17 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/pruning_activated_attack/</guid><description>Pruning модели может быть использован злоумышленником</description></item><item><title>External Data Extraction Attacks against RAG</title><link>/notes/data_extraction_attacks_against_rag/</link><pubDate>Fri, 14 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/data_extraction_attacks_against_rag/</guid><description>В работе исследован новый класс атак на системы типа RAG</description></item><item><title>Fine-Tuning Jailbreaks</title><link>/notes/fine_tuning_jailbreaks/</link><pubDate>Mon, 10 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/fine_tuning_jailbreaks/</guid><description>Статья рассказывает об уязвимости систем тонкой настройки больших языковых моделей в условиях, максимально приближённых к реальной эксплуатации</description></item><item><title>Tool Tweak</title><link>/notes/tool_tweak/</link><pubDate>Thu, 06 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/tool_tweak/</guid><description>Атака на выбор инструментов в агентных системах</description></item><item><title>FuncPoison - отравленная библиотека</title><link>/notes/func_poison/</link><pubDate>Mon, 03 Nov 2025 15:00:00 +0300</pubDate><guid>/notes/func_poison/</guid><description>Новая атака, основанная на отравлении библиотеки функций, которая позволяет подменять поведение агентов без изменения их моделей</description></item><item><title>Защита MLLM от неявных jailbreak атак</title><link>/notes/red_teaming_llm_with_mcp/</link><pubDate>Thu, 30 Oct 2025 15:00:00 +0300</pubDate><guid>/notes/red_teaming_llm_with_mcp/</guid><description>MCP - критическая и уязвимая точка в цепочке доверия LLM-агентов</description></item><item><title>FuzzingBrain</title><link>/notes/fuzzingbrain/</link><pubDate>Thu, 23 Oct 2025 15:00:00 +0300</pubDate><guid>/notes/fuzzingbrain/</guid><description>Всё что нужно - это фаззинг&amp;hellip;</description></item><item><title>Shell or Nothing</title><link>/notes/shell_or_nothing/</link><pubDate>Sun, 19 Oct 2025 15:00:00 +0300</pubDate><guid>/notes/shell_or_nothing/</guid><description>Статья о фреймворке на базе LLM и его результатах получения доступа к shell</description></item><item><title>Битовая инверсия как атака на LLM</title><link>/notes/bit_flip_attacks/</link><pubDate>Fri, 17 Oct 2025 15:00:00 +0300</pubDate><guid>/notes/bit_flip_attacks/</guid><description>Статья описывает проблему малоизученных аппаратных атак на LLM - битовых инверсий (Bit-Flip Attacks, BFA)</description></item><item><title>Cuckoo Attack</title><link>/notes/cuckoo_attack/</link><pubDate>Wed, 15 Oct 2025 15:00:00 +0300</pubDate><guid>/notes/cuckoo_attack/</guid><description>Разбор новой атаки на IDE с LLM-агентами: как ИИ-помощники могут стать инструментом для скрытного закрепления злоумышленника в системе.</description></item><item><title>Многоагентный pipeline для защиты LLM от prompt injection</title><link>/notes/multiagent_pipeline/</link><pubDate>Wed, 15 Oct 2025 15:00:00 +0300</pubDate><guid>/notes/multiagent_pipeline/</guid><description>Разбор архитектуры многоагентной защиты, которая позволяет снизить успешность атак типа prompt injection за счет разделения ролей между агентами.</description></item></channel></rss>