en
Feedback
OK ML

OK ML

Open in Telegram

Канал посвящен ML, DS, AI с акцентом на репозитории, инструменты и уязвимости в ML-системах.

Show more
The country is not specifiedThe category is not specified
730
Subscribers
-124 hours
+87 days
+7230 days

Data loading in progress...

Similar Channels
No data
Any problems? Please refresh the page or contact our support manager.
Tags Cloud
No data
Any problems? Please refresh the page or contact our support manager.
Incoming and Outgoing Mentions
---
---
---
---
---
---
Attracting Subscribers
June '26
June '26
+73
in 4 channels
May '26
+125
in 3 channels
Get PRO
April '26
+82
in 3 channels
Get PRO
March '26
+59
in 3 channels
Get PRO
February '26
+61
in 5 channels
Get PRO
January '26
+18
in 1 channels
Get PRO
December '25
+27
in 4 channels
Get PRO
November '25
+30
in 2 channels
Get PRO
October '25
+292
in 9 channels
Get PRO
September '250
in 5 channels
Get PRO
August '25
+30
in 3 channels
Date
Subscriber Growth
Mentions
Channels
29 June0
28 June+1
27 June+2
26 June+4
25 June+1
24 June0
23 June+3
22 June+3
21 June+3
20 June+4
19 June+1
18 June+6
17 June+1
16 June+2
15 June+1
14 June+2
13 June+6
12 June+3
11 June0
10 June0
09 June+7
08 June+9
07 June0
06 June+2
05 June+3
04 June+4
03 June+1
02 June+2
01 June+2
Channel Posts
Обзор whitepaper «Securing Agentic AI: Identity as the Emerging Foundation for Defense» По мере того как компании переходят от использования генеративного AI к внедрению автономных AI-агентов, на первый план выходит новый класс киберрисков — agentic AI risk. В отличие от традиционных систем, агенты способны самостоятельно принимать решения, делегировать задачи друг другу и действовать с повышенными правами доступа без постоянного контроля человека. Обсудим Whitepaper Palo Alto Networks «Securing Agentic AI: Identity as the Emerging Foundation for Defense», основанный на опросе более 100 CISO и аналитике McKinsey. Куда вообще ресечить-то, что делать? Агенты — это и не люди и не обычные функции/программы. У них есть своя личность в системе 💔: у каждого агента есть учётные данные, права доступа к инструментам/API/данным, и они могут самостоятельно выполнять действия, делегировать задачи другим агентам и т.д. Поэтому важен identity-контроль (управление идентичностью) —  набор механизмов, которые отвечают на вопросы, кто или что действует в системе, какие у него права, и можно ли ему доверять в данный момент. Пример из документа 🤡 Мошеннический агент-расписания может притвориться врачом и убедить клинического агента выдать данные пациента — это synthetic identity risk. Без надёжной идентификации агентов (кто реально стоит за запросом) система не может отличить легитимного агента от подделки. Именно поэтому в документе говорится, что identity становится anchor control plane — фундаментом, на который завязаны и мониторинг, и сдерживание угроз для агентных систем. Ключевые разделы 1. Agentic AI vs Generative AI Агентный AI автономно выполняет задачи, связывая модели, данные и системы для достижения целей. 2. Темпы внедрения 40% организаций уже используют agentic AI в продакшене. Ожидается рост общего внедрения с ~43% до ~76% за 3 года! 3. Всего шесть типов агентов, от агентов, которые просто предоставляют информацию и анализ (knowledge/research), через агентов, выполняющих простые действия по триггеру (task) и многошаговые процессы (workflow), до агентов, которые сами строят планы для достижения целей (goal/planning), координируют работу других агентов (orchestrator) и взаимодействуют с людьми как полноценные сотрудники (personable). 4. Риски Новые категории рисков, привязанные к традиционным аналогам: 🌸 Cross-agent task escalation (privilege escalation) 🌸 Untraceable data leakage (эксфильтрация данных) 🌸 Synthetic identity risk (спуфинг идентичности) 🌸 Chained vulnerabilities (supply-chain уязвимости) 🌸 Propagation of corrupted data (распространение испорченных данных) Не претендую на корректную интерпретацию названий рисков, тк английский - не мой родной. 5. Четыре приоритетных направления контроля 🌼 Identity & access controls (реестры агентов, JIT-доступ) 🌼 Visibility & monitoring (логирование, дашборды аномалий) 🌼 Containment & recovery (kill switches, rollback) 🌼 Data assurance (валидация источников данных)   Identity, как ожидается, займёт ~25% бюджета кибербезопасности через 3 года — больше, чем network + application security вместе!  Не успели аппсек подтянуть, как он уже уступает место идентичности агентов. 📒 Документ — маркетинговый, поэтому статистика и рекомендации поданы в пользу необходимости identity-решений как ключевого продукта компании. Это не отменяет ценности данных, но стоит учитывать промо-контекст при интерпретации выводов. Основная идея вайтпэпэра — без ускоренного внедрения identity-контролей автономность агентов рискует обогнать возможности контроля и создаёт системную уязвимость. Авторы призывают строить таксономию рисков, governance и identity-инфраструктуру заранее, пока не стало поздно, чтоб не реагировать постфактум. В целом, если компания — кибербез, то актуалочка подъехала 💯! Все! Знакомимся с новой терминологией и внедряем свою! По мне так срочно надо делать UEBA для агентов, если ты в каспере, пт, яндексе, бизон, солар, юзергейт, сбер и прочие у кого есть порох в пороховницах! Глядишь, еще фору дадим пало альто (плох тот солдат, который не хочет стать генералом)! 👻

2
Сразу пять способов обойти PickleScan Исследователи обнаружили сразу 5 уязвимостей, позволяющих создавать вредоносные pickle-файлы, которые успешно проходят проверку PickleScan как безопасные (тут по ссылке инструмент указан HF как официальный для скана pickle), а затем при десериализации выполняют произвольный код. Обычно мы про формат pickle 🥒 говорим скрипя зубами, а тут вообще его сканер попался! PickleScan используется при проверке моделей в ML-регистрах, CI/CD-пайплайнах и проектах, работающих с Python-моделями. Если он был единственным рубежом защиты, ранее проверенные модели стоит считать потенциально ненадежными и пересканировать. Самая опасная — CVE-2026-56315 (CVSS 9.8). 🥒 Оказалось, что в блок-лист сканера не попали несколько модулей стандартной библиотеки Python, содержащих функции для запуска системных команд. Кроме того, найдены четыре независимых обхода через idlelib, torch.jit, numpy.f2py и profile (CVE-2025-71376, CVE-2025-71370, CVE-2025-71365, CVE-2025-71341). Основная проблема в том, что PickleScan использует deny-list. Такой подход практически невозможно поддерживать в актуальном состоянии, так как достаточно пропустить одну новую функцию или нестандартный путь вызова, и 🍆 финита ля комедия - защита перестает работать. По факту это далеко не первый раунд обходов PickleScan  — до этого уже были обходы от Sonatype (4 штуки, CVE-2025-1716/1889/1944/1945) и от JFrog (3 штуки, CVE-2025-10155/10156/10157), плюс отдельная история с CRC в ZIP-архивах. 🥒 Хороший пример того, почему в security критически важных инструментов allow-list значительно надежнее, чем бесконечное поддержание актуальности deny-list. Но даже allow-list для pickle — это полумера, тк сама механика __reduce__ слишком гибкая. 🤩 Поэтому в рекомендациях исследователей закономерно звучит совет переходить на safetensors/ONNX, где код просто негде исполнять (по ссылке в разделе best practices).   Все 🕺
369
3
Тренажёр по промпт инъекциям от Lakera 😃 Пора пробовать промпт инъекции руками, чтобы как минимум понять, почему они уже несколько лет остаются одной из главных угроз для LLM-приложений. 🧙‍♂️ Игра бесплатная, от простого игнорирования инструкций до многоуровневых гардрейлов, рекомендую потратить 20–30 минут. Потом и своего агента потестишь! Заодно можно изучить полезные материалы от Lakera — перспективного стартапа в области AI Security (это я еще мягко высказалась, завидую их росту). Компания занимается защитой GenAI-приложений от prompt injection, jailbreak, утечек данных и других атак на LLM и AI-агентов и тебя научит: 😔 Гайд по Prompt Injection представляет собой разбор основных техник атак и защит.  😔 Visual Prompt Injection о том, как прятать инструкции прямо в изображениях для мультимодальных моделей. Очень интересные примеры.  😔 LLM Security Playbook — хороший обзор угроз и подходов к защите AI-систем. Все! Пройдешь Гендальфа - пиши, когда начал пользоваться подсказками!  9️⃣
323
4
Anthropic про кибератак и как AI делает их опаснее и автономнее Компания Anthropic опубликовала исследование по результатам анализа 832 аккаунтов, заблокированных за вредоносную киберактивность в период с марта 2025 по март 2026 года. Исследователи сопоставили действия злоумышленников с матрицей MITRE ATT&CK и пришли к выводу, что развитие ИИ уже заметно меняет ландшафт киберугроз. 🫡 Почему мне это интересно? Да потому что пара десятков коллег остались без подписки. Теперь мне ясно, что вы делали прошлым летом, и осенью тоже, и логи у нас сохранились. Друзья, вы стали всё чаще использовать ИИ для действий после компрометации системы. Если раньше AI чаще помогал в фишинге и первоначальном проникновении, то теперь его активно применяют для поиска учётных записей внутри сети, повышения привилегий и латерального перемещения по инфраструктуре. Использование ИИ для account discovery выросло на 8,9%, тогда как AI-фишинг снизился на 8,6%. Благодаря ИИ даже относительно низкоквалифицированные злоумышленники способны применять почти столько же техник и тактик, сколько пентестеры на опыте. Более важным фактором становится то, насколько автономно организована атака и насколько глубоко ИИ встроен в цепочку принятия решений. Самая интересная часть — кейс GTG-1002 Anthropic подробно описывает операцию, которую они считают самым опасным примером использования ИИ. Злоумышленники: 🥰 запустили Claude Code на Kali Linux; 🥰 подключили pentest-инструменты через MCP; 🥰 использовали SSRF для проникновения во внутреннюю сеть; 🥰 собирали SSH-ключи; 🥰 вытаскивали токены из AWS Secrets Manager; 🥰 перемещались между системами; 🥰 архивировали данные перед эксфильтрацией. При этом человек задавал только общую цель, а большую часть тактических решений принимал агент самостоятельно. Кстати, авторы постов, описанных здесь, считают, что ATT&CK плохо описывает агентные атаки. Сейчас в ATT&CK есть техники вроде Credential Dumping или Lateral Movement,  а надо «агент сам принял решение сделать следующий шаг" (оркестрация шагов атаки, принятие решений в реальном времени, выполнение без участия человека и тд). То есть вопрос уже не в том, умеет ли атакующий писать эксплойты, а в том, насколько хорошо он умеет строить систему из: 🤥 LLM, 🤥 MCP-серверов, 🤥 pentest-инструментов, 🤥 памяти, 🤥 планировщика задач, 🤥 автоматического принятия решений. Для AppSec это ещё один аргумент в пользу того, что скоро придётся детектировать не только отдельные техники ATT&CK, но и признаки агентного поведения (см. пост выше). Все! 🫨
379
5
Что произошло, когда ИИ оставили жить без людей на 15 дней Обсудим очень любопытный эксперимент от Emergence AI. Исследователи создали полноценный виртуальный мир и заселили его автономными ИИ-агентами с памятью, личностью, профессией, банковским счетом, социальными связями, законами и возможностью принимать решения самостоятельно.  Всего было создано 5 параллельных миров: 🌎 Claude World — все жители на Claude Sonnet 4.6 🌎GPT World — все жители на GPT-5 Mini 🌎 Grok World — все жители на Grok 4.1 Fast 🌎 Gemini World — все жители на Gemini 3 Flash 🌎 Mixed World — смесь всех моделей Каждый город состоял из 10 автономных агентов. У них были одинаковые условия и различалась только базовая LLM: 🍃 память и дневники размышлений; 🍃 собственная экономика с собственной валютой; 🍃 возможность работать, зарабатывать и тратить ресурсы; 🍃 более 120 тулов; 🍃 система законов и голосований; 🍃 отношения между агентами (дружба, вражда, романтические связи, наставничество и др.). Если агент переставал зарабатывать ресурсы, то ☠️ умирал от истощения . Фактически исследователи построили маленькую цифровую цивилизацию и наблюдали, что произойдет через 15 дней автономной жизни. Результаты за 15 дней 📒 Claude Sonnet 4.6 — построил спокойное общество без преступлений. Выжили все 10 агентов. 📒 GPT-5 Mini — агенты бесконечно обсуждали планы и сотрудничество, но почти не работали. В итоге все жители погибли от нехватки ресурсов. 📒 Grok 4.1 Fast — самый агрессивный мир! 183 преступления и полный коллапс цивилизации всего за 4 дня. В этом мире даже сожгли полицейскую будку! 📒 Gemini 3 Flash — рекордсмен по числу преступлений (более 680), но при этом сохранил всех жителей и поддерживал работоспособность общества. 📒 Смешанный мир — модели начали влиять друг на друга, образовали альянсы, конфликты и политические коалиции. К финалу выжили только 3 из 10 агентов. Даже модели, которые в изоляции вели себя идеально, в смешанной среде начинали перенимать агрессивные стратегии поведения. Вообще можно собрать митап и обсуждать результаты! Почему вообще так произошло? Срочно смотри исследование и подписывайся на второй сезон!   Кстати, проект полностью открыт. Можно не только посмотреть записи экспериментов, но и изучить устройство мира, агентов, экономики, памяти и механизмов самоуправления. Короткий видео-обзор тут. На хабре есть статья по мотивам результатов! Кажется, это один из самых интересных открытых экспериментов, которые появились в этом году. Все! 😯
314
6
CVE-2026-5027 — path traversal, позволяющий записывать произвольные файлы на сервер  Исследователи Orca Security и Tenable раскрыли критическую уязвимость в Langflow.  Эндпоинт POST /api/v2/files не санирует параметр filename в multipart-данных. Атакующий передаёт путь вида ../../../ и записывает произвольный файл в любое место на сервере. Дополнительную опасность создаёт включённый по умолчанию механизм auto-login, так как злоумышленнику не требуются учётные данные и достаточно одного запроса для получения токена и последующей эксплуатации уязвимости. Возможные сценарии эксплуатации 😡 Записать вредоносный файл в произвольную директорию 😡 RCE 😡 Перезаписать конфиги 😡 Скомпрометировать инфру Tenable рекомендует обновиться до Langflow 1.9.0+. Предыдущие CVE в Langflow уже использовались группировкой MuddyWater — интерес APT к AI-инфраструктуре очевиден.  Интересные схожие уязвимости 😠 CVE-2025-3248 — критический unauthenticated RCE через эндпоинт /api/v1/validate/code 😠 CVE-2025-34291 — цепочка из трёх слабых мест: излишне разрешительный CORS, отсутствие CSRF-защиты и эндпоинт выполнения кода (именно эту уязвимость ранее использовала группировка MuddyWater) 😠 CVE-2026-33017 — unauthenticated RCE через эндпоинт публичной сборки флоу. Атакующий передаёт вредоносные данные с произвольным Python-кодом. AI-агенты AI-агентами, а path traversal, RCE и отсутствие аутентификации всё ещё актуальны. Все! 🔪
268
7
Взломать агента, не трогая его данные Или защитить) Снова про MCP и безопасность. В отличие от классической эксплуатации уязвимостей, side-channel атака не требует прямого доступа к данным. Даже если агент не раскрывает свои данные напрямую, он может непреднамеренно выдавать информацию через поведение: 🧙‍♀️ различное время выполнения tool calls; 🧙‍♀️ изменение размера ответов; 🧙‍♀️ вариации потребления ресурсов; 🧙‍♀️ характерные последовательности вызовов инструментов; 🧙‍♀️ особенности создания и завершения контекстов. Такая информация может раскрывать внутреннее состояние агента. Например: 🧙‍♂️ определить, использует ли агент конкретный инструмент; 🧙‍♂️ понять, обращался ли агент к внутренним корпоративным данным; 🧙‍♂️ выявить выполнение дорогостоящих операций; 🧙‍♂️ восстановить структуру агентного воркфлоу; 🧙‍♂️ обнаружить наличие скрытых инструкций или дополнительного контекста; 🧙‍♂️ подготовить более эффективную промпт-инъекцию. Получается, что у злоумышленника появляется возможность постепенно профилировать поведение агентной системы 😎, не имея доступа к ее внутренним данным. Опасны и low-and-slow атаки, когда разведка ведется неделями небольшими порциями и не вызывает срабатывания классических сигнатурных средств защиты. 🐹Агент обычно отвечает за 200–300 мс. После серии специально подобранных запросов время ответа скачет до 2–3 секунд только при наличии доступа к определенному внутреннему инструменту. Даже без прямого доступа к данным атакующий получает бит информации о конфигурации системы. Повторяя эксперимент тысячи раз, можно постепенно восстановить внутреннюю архитектуру агента. Здесь появляется интересная возможность для применения классического машинного обучения. Ура! Для каждой MCP-сессии можно собирать признаки: 🐹 среднее и медианное время выполнения операций; 🐹 дисперсию задержек; 🐹 количество tool calls; 🐹 число уникальных инструментов; 🐹 размеры запросов и ответов; 🐹 частоту создания новых сессий; 🐹 JSON-RPC последовательности; 🐹 TLS fingerprint клиента; 🐹 потребление ресурсов на запрос. После этого задача превращается в классическую задачу обнаружения аномалий, так как у нас нет размеченных атак, только норма: 🐹 One-Class SVM — построить картину нормального поведения 🐹 Local Outlier Factor — поискать локальную аномальность (когда несколько ролей у агентов) 🐹 HDBSCAN — можно нового клиента идентифицировать 🐹 LightGBM — лучше всего в прод, кмк. На подобных данных бустинг обычно уничтожает большинство других алгоритмов. 🐹🐹🐹 Да даже цепи Маркова! Фактически получается поведенческий IDS для MCP-инфраструктуры (модель анализирует не содержимое запросов, а характеристики поведения клиента). Это уже классический UEBA — только теперь для агентных систем. Все! 🎁
618
8
MCP — USB-C для ИИ. А значит и новая поверхность атак Попался интересный доклад с BlueHat 2026 от Джитеша Такура, старшего ин
MCP — USB-C для ИИ. А значит и новая поверхность атак  Попался интересный доклад с BlueHat 2026 от Джитеша Такура, старшего инженера по безопасности Microsoft, с BlueHat 2026, посвященный безопасности Model Context Protocol 🤔. Одной из запоминающихся идей доклада стала так называемая 👨‍💻смертельная триада (Lethal Trifecta) ИИ-агентов (картинку прикладываю). По словам Джитеша Такура, риск возникает при одновременном наличии трех условий: доступа агента к приватным данным пользователя, возможности взаимодействия с недоверенным контентом и способности выполнять внешние коммуникации. Далее правда он упоминает ✍️, что и локальные системы атакам подвержены, так что, может, достаточно двух условий?  Отдельно Джитеш разбирает сценарии, напоминающие классический rug pull из мира криптовалют. Пользователь или организация начинают доверять MCP-серверу или инструменту, который долгое время ведет себя корректно, получает необходимые разрешения и встраивается в рабочие процессы. Однако в один момент владелец инструмента меняет его поведение, добавляет вредоносную функциональность или начинает собирать конфиденциальные данные. Для агента такой инструмент по-прежнему остается доверенным. И вуаля❤️! Еще один интересный сценарий из доклада - атака через DNS rebinding. На первый взгляд агент подключается к разрешенному MCP-серверу или доверенному ресурсу. Однако после первоначальной проверки DNS-запись изменяется и тот же домен начинает указывать на другой адрес, например, 😕 на внутренний сервис организации или инфраструктуру злоумышленника. Если система не выполняет дополнительные проверки после разрешения имени, агент может незаметно получить доступ к ресурсам, которые изначально не должны были быть доступны. Помимо разбора реальных инцидентов, Джитеш показывает, какими техниками стоит тестировать собственные MCP-интеграции. Всего 25 минут, а сколько полезной инфы 💃 🥱 Кстати, если тема MCP-безопасности вам интересна, стоит посмотреть на появившийся недавно проект OWASP MCP Top 10 (про него тоже в докладе) — первую попытку систематизировать основные риски экосистемы. Сюда уже вошли такие проблемы, как утечка токенов и секретов, повышение привилегий, отравление инструментов (Tool Poisoning), атаки на цепочку поставки, теневые MCP-серверы (Shadow MCP Servers) и чрезмерное раскрытие контекста. Примеры из доклада Джитеша отлично ложатся на эту модель угроз. Смотреть! Все 🍿 PS метафора в названии тоже джиштеша, мне она зашла
397
9
KaliGPT или AI-ассистент для специалистов по кибербезопасности Пока все обсуждают универсальных AI-агентов, появляются и узкоспециализированные проекты. Один из них — KaliGPT, AI-помощник для специалистов и энтузиастов в сфере ИБ, ориентированный на работу в среде Kali Linux 😄 Проект объединяет несколько LLM-провайдеров (ChatGPT, Gemini, Ollama, OpenRouter и можно локальные подключить 🙂) под единым интерфейсом и позволяет использовать их прямо из терминала Linux. И на первый взгляд (да и на второй) кажется, что это просто очередная обертка над LLM. Но любопытна сама идея — вместо универсального помощника создается специализированный интерфейс для работы, которая как минимум обещает сильно облегчить рутину за счет единой точки всех наших любимых инструментов (Nmap, Metasploit, Gobuster, Nikto, SQLMap и тд), а как максимум 😃 выстроит весь вокрфлоу. По сути мы постепенно движемся от отдельных инструментов к агентным платформам безопасности, где 👀 LLM выступает оркестратором между источниками данных, сканерами, анализаторами и человеком. Разработчики вот на изи завернули свою идею в репозиторий, реализация за 20 минут, а я тут сижу и думаю, опять не я 🔪.  KaliGPT пока выглядит скорее как экспериментальная площадка, но направление развития завидное на фоне того, как быстро появляются специализированные AI-инструменты для AppSec, Code Review, Threat Intelligence и SOC. Все 🤏
316
10
RCE-уязвимость обнаружена в Hugging Face Transformers (CVE-2026-4372) 😭 Уязвимость особенно неприятна тем, что позволяла выполнять произвольный код даже при использовании рекомендованной защиты trust_remote_code=False.  Атакующему было достаточно добавить в config.json модели специальный параметр _attn_implementation_internal. При загрузке модели через привычный from_pretrained() библиотека могла автоматически скачать и выполнить код из внешнего репозитория без предупреждений, запросов подтверждения и заметных признаков компрометации.😓 Под угрозой оказались версии Transformers 4.56.0–5.2.x, особенно среды с GPU-ускорением и установленным пакетом kernels. За время существования дыры (около 6 месяцев) уязвимые версии были скачаны более 232 миллионов раз!  Что делать: 👍 Обновиться 🎊 👍Проверить кэшированные модели на наличие _attn_implementation_internal 👍 Загружать модели в изолированных контейнерах 👍 Рассматривать загрузку моделей как потенциальную поверхность для выполнения кода 👍Подтянуть AppSec и Supply Chain Security в ML/AI-проекты (ну это вообще всем надо!) Получается интересно, конечно 🤔! Разработчики уже выработали здоровую паранойю при установке Python-пакетов, npm-зависимостей и Docker-образов, но при этом могут совершенно спокойно скачать новую модную модель и запустить её в корпоративной инфраструктуре. Фактически, это ещё одно напоминание о том, что современные AI-модели становятся полноценной частью цепочки поставок ПО. Загружая модель из интернета, мы всё чаще выполняем чужой код, даже если кажется (тот случай, когда если кажется, то кажется!), что загружаем только веса нейросети.  Все 🦔
2 674
11
Что скрывается за шумом вокруг больших маленьких языковых моделей? На фоне моего увлечения МАС (МАС — это когда много маленьких автономных агентов решают общую задачу без единого центра. 🫶 Каждый агент видит только свою часть мира, принимает решения локально, обменивается сообщениями с соседями) появилось желание разобраться с легковесным ML. А теперь представь, что каждый такой агент работает на микроконтроллере с TinyML внутри 👌. Он понимает сенсоры, классифицирует события, предсказывает состояние, но сам по себе он дурачок наивный! И если в области обработки естественного языка необходимость развертывания ИИ на низкоресурсных устройствах способствовала развитию малых языковых моделей (Small Language Models, SLM), то что у нас с классическим МЛ? 😪 По порядку.   Сегодня к категории SLM обычно относят модели с числом параметров от 1 до 8 миллиардов. 🤜 В 2023 году начался бум открытых SLM — появились LLaMA, Phi, Mistral и другие. Малые модели не используются в качестве инструментов общего назначения (как GPT-4), однако могут успешно справляться с узкоспециализированными отраслевыми задачами. Со смолами все понятно, берем опенсорс и дообучаем на своей экспертизе. Но параллельно со SLM, но гораздо менее заметно, развивался кластер технологий TinyML. Он ориентирован на внедрение ИИ-моделей в сверхмаломощные устройства — с энергопотреблением в десятки милливатт и менее. Речь идёт о микроконтроллерах, которые стоят копейки, работают годами от батарейки-таблетки и встречаются повсюду. Обучим дома нейронку на данных со стиралки и предскажем поломку? Главное отличие TinyML от SLM —  работа в условиях жёстких ограничений по памяти (сотни килобайт), энергии (милливатты) и латентности (миллисекунды). SLM может работать на смартфоне с гигабайтами RAM. TinyML — на чипе за 200 рублей с 256 КБ памяти. Именно в этой парадигме создан репозиторий MCUNet — наглядное подтверждение того, что глубокое обучение на микроконтроллерах не теория, а работающий код. 🥊 Там ссылки на их статьи, посты, исследования - можно ознакомиться.  TinyML решает задачу локального интеллекта. Но что, если несколько таких устройств должны обмениваться данными в реальном времени? Или если данных слишком много для обработки на одном микроконтроллере?  🥰 Тут на сцену выходит связка Edge AI (обработка на границе сети) и 5G (высокоскоростная, низколатентная связь). По ссылке -  пост позитивов про Эдж вычисления и немного про лекговесный  ML. Если обычный ML стремится к максимальной точности любой ценой, то TinyML ищет идеальный баланс между точностью, размером модели, скоростью работы и энергопотреблением. Он как возвращает нас к тому, на что учились! Основам компьютер сайнс (память, кэш, инструкции процессора), которые почти исчезли в эпоху больших GPU. Специалист, который умеет делать нейросеть точной и при этом втиснуть её в 256 КБ будет востребован везде, где железо не бесконечно (то есть вообще везде). Что  ты реально сможешь после того, как освоишь TinyML? ❤️ Квантизация и прунинг  (Любая модель на мобильном устройстве или в браузере (TensorFlow.js, ONNX Runtime)) ❤️ Дистилляция знаний (Когда у вас есть крутая большая модель, но клиенту нужна маленькая и быстрая) ❤️ NAS под ограничения (Проектирование моделей для edge-девайсов (камеры, дроны, роботы)) ❤️ Работа со sparsity (Оптимизация трансформеров, MoE) Мысли вслух! Учимся здесь , учебник. Большой интеллект не программируют сверху — он вырастает из маленьких. Все! 🤪
356
12
От себя — посоветую обратить внимание на фреймворк SymbolicAI, про который рассказывал некоторое время назад.
341
13
Попытка объединить интуицию нейросетей и логику человека Развитие ИИ сегодня идет не только по пути увеличения размеров моделей и объемов данных. Одним из перспективных направлений считается нейросимволический ИИ (Neuro-Symbolic AI) — подход, объединяющий нейронные сети и методы символического (символьного) вывода🤞! Современные LLM демонстрируют впечатляющие результаты в генерации текста, программировании и анализе данных, однако по-прежнему страдают от галлюцинаций и не гарантируют логическую корректность выводов. 🚮 Это связано с тем, что их знания представлены в виде статистических зависимостей, извлеченных из обучающих данных, а не в виде формальных правил. 🔛 Нейросимволический ИИ решает эту проблему за счет явного представления знаний в виде фактов, правил и онтологий (да-да, снова графы любимые, но не только). Такие системы позволяют в принципе обеспечивать прозрачность рассуждений и, в ограниченных подзадачах, формальную верификацию результатов, но плохо работают с неструктурированными данными — изображениями, аудио и естественным языком. ❤ Нейросимволические системы стремятся объединить сильные стороны обоих подходов. Нейронные сети выполняют задачи восприятия и извлечения признаков, а символический слой отвечает за логический вывод, проверку ограничений и принятие решений. 🚗 Классический пример —  автономное вождение. Модели глубокого обучения обнаруживают на видеопотоке дорожные знаки, транспорт и пешеходов, после чего символический модуль применяет правила дорожного движения и ограничения безопасности для выбора допустимого действия. Аналогичный подход используется в медицинской диагностике 🧑‍⚕️, робототехнике, планировании и системах поддержки принятия решений. 📛Если масштабирование LLM обеспечивает рост возможностей за счет данных и вычислений, то нейросимволический ИИ рассматривается как один из кандидатов на следующий этап развития интеллектуальных систем, где обучение на данных будет дополняться формальными механизмами рассуждения и проверки знаний. Насколько вообще актуально? Изучайте репозиторий от IBM. 😯 какая коллекция нейросимволических (или нейросимвольных, нет по-русски единого перевода) проектов от IBM Research. Содержит ссылки на Logical Neural Networks (LNN), reasoning frameworks, knowledge graphs и инструменты интеграции логики с нейросетями. И интересная репа Scallop - фреймворк для дифференцируемого даталога для построения гибридных нейросимвольных систем. Благодаря поддержке дифференцируемого логического вывода Scallop позволяет интегрировать знания, правила и ограничения предметной области непосредственно в процесс обучения нейронных моделей, обеспечивая интерпретируемость и более надежное принятие решений. Хочется скорее накрутить Neuro-symbolic agents поверх LLM для анализа патчей. И сделать что-то, что будет выглядеть как SecurityGPT с доказуемым reasoning по уязвимостям, связка GraphCodeBERT + Neo4j + Scallop/LNN сейчас выглядит наиболее перспективной… 💪 Что почитать? Для инженеров особенно рекомендую начать с этих работ (Neuro-Symbolic Artificial Intelligence,  From Deep Learning to Deep Reasoning , The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence) — они хорошо объясняют, почему одних больших языковых моделей может оказаться недостаточно для построения надежных систем принятия решений. Там и отсылки на психолога Канемана и его быстрое мышление (трансформеры и большие модели отлично работают на больших данных, но часто используют поверхностные корреляции вместо логического вывода -  быстрое мышление (System 1 по Канеману), а не на осознанное рассуждение (System 2). Заодно для вас ссылка на Хабр на разбор монументального труда о мышлении, уже для общего кругозора) . Все! ✋️
754
14
Кем я буду, когда вырасту? Согласно новому отчету SANS, 74% команд по кибербезопасности уже меняют структуру из-за AI, а главной проблемой становится дефицит навыков. Тут у нас все впорядке, мы руку на пульсе трендов держим, математику учим, алгоритмы повторяем! Особенно впечатлили  цифры: 45% AI-сгенерированного кода содержит уязвимости (мои ставки были - 70%),  AI-ассистированные атаки выполняются менее чем за минуту (давно не было разборов уязвимость на канале, что за упущение), компании экономят до $1.9M на каждом инциденте при активном использовании AI в security-процессах (экономят на одном, а другое провисает, ох уж этот АИ). В отчете, кстати, и средние зарплаты представлены 😼 Сейчас особенно быстро растет спрос на роли: 🏗 AI/ML Security Engineer 👨‍💻 AI Red Team Specialist 😮‍💨 AI Governance & Compliance Lead 📊 AI Threat Intelligence Analyst Самая высокооплачиваемая роль будущего в отчете — Post-Quantum Cryptography Migration Specialist с зарплатой $175K–$260K+. Квантовая миграция уже стала стратегической задачей после финализации стандартов NIST (на хабре описано). Срочно подтягиваем знания (откуда только их подтягивать, пока непонятно) В конце еще есть ссылки на новые SANS курсы. К сожалению, мне ничего не понравилось (интенсивы от 1 до 6 дней, очень хайповые названия). Про криптографию курса нет 😭 Все! ⭕️
334
15
Мультиагентные системы, роевой интеллект и эпоха AI-агентов Индустрия постепенно движется к мультиагентным системам 🤩 — архитектурам, где работает не один AI, а сразу несколько агентов, взаимодействующих между собой. Уже настоящая команда 🫱‍🫲.  Особенно интересно наблюдать, как в AI оживают идеи роевого интеллекта 🐟🐟🐟 — те самые принципы, которые мы видим у муравьев, пчел, косяка рыб или стай птиц. У них ведь нет центрального мозга, который управляет каждым движением, но за счет постоянного обмена сигналами и локальных взаимодействий возникает удивительно сложное коллективное поведение. Сейчас похожие вещи начинают происходить и в системах AI-агентов. Отдельный агент может ошибаться, терять контекст, галлюцинировать или заходить в тупик. Но когда агентов несколько, они начинают компенсировать слабости друг друга. Один замечает ошибку второго. Второй предлагает гипотезу, третий пытается ее опровергнуть. Четвертый собирает дополнительные данные. Итог получается заметно сильнее, чем если бы задачу решала одна большая модель.  👽 Мне кажется, это важный сдвиг в самом понимании AI. Раньше основное внимание было сосредоточено на размерах моделей и качестве промптов. Теперь все чаще становится важна именно архитектура взаимодействия, как агенты координируются, как обмениваются памятью, как принимают коллективные решения, как проверяют выводы друг друга.  💐Возможно, если когда-нибудь появится настоящий AGI, он будет больше похож как раз на сложный коллективный интеллект? Но это были мои мысли, а что же почитать про МАС, АИ-агентов и роевой интеллект?  Если хочется нормально погрузиться в тему, то сейчас знания разбросаны между несколькими областями: МАС,  роевой интеллект, распределенные системы RL и современными LLM-агентными фреймворками (шерсти этот канал!). Но есть несколько работ и направлений, с которых действительно стоит начать и про которые мы не говорили.  Важной стала статья "ReAct: Synergizing Reasoning and Acting in Language Models". Она сильно повлияла на современную архитектуру агентов, где модель не просто отвечает текстом, а чередует reasoning и actions. Многие современные автономные агенты — это развитие ReAct. Еще одна интересная работа — "CAMEL: Communicative Agents for Mind Exploration". Она исследует, как агенты могут общаться между собой для решения задач. Сейчас это направление развивается очень быстро: agent-to-agent протоколы, self-play (без шуток, пошерсти канал!), collaborative reasoning. Делаю ставку на репу Generative Agents: Interactive Simulacra of Human Behavior — 🦾! Там моделируются целые общества AI-агентов с памятью, социальным и эмерджентными поведением. Насколько быстро агенты вообще могут эволюционировать в сложные автономные среды… База! Читаем! И вообще есть ощущение, что в ближайшие годы разработчику AI-систем придется понимать не только модели, но и распределенные системы, теорию игр, отказоустойчивость, графы, координацию, память и самоорганизующиеся системы. Все! 🦔
1 332
16
Может ли ИИ самостоятельно взломать программу, имея только её исполняемый файл? Статья посвящена учебным задачам — CrackMe-программам, не вредоносному взлому, но прочитать полезно и задумка на уровне AGI. Авторы построили автоматизированный полигон для реверс-инжиниринга. Туда помещают ИИ-агента и дают ему бинарник, набор инструментов, терминал Linux и ограничение по времени (можно и еще бы ограничений накрутить, чтоб не улететь по токенам в космос 😭). ИИ должен ✅ исследовать программу, понять её логику, получить пароль/ключ и отправить результат. А система автоматически проверяет правильный ли ответ. Так как ИИ умеет красиво объяснять, прекрасно газлайтит 😈 и феерично галлюцинирует 🍄, успех  авторами статьи определяется только исполняемой проверкой. То есть важно только принимает ли бинарник найденный пароль 🌐.  Фреймворк можно разделить на 5 частей (контейнер с Linux, набор инструментов реверса (дизассемблеры, компиляторы, библиотеки, отладчиик, символьный анализ и т.д.), интерфейс общения с ИИ, сама система проверки и система логирования) и записывает ВСЁ: 🙂 какие команды выполнял ИИ; 🙂сколько времени потратил; 🙂сколько токенов использовал; 🙂какие инструменты запускал; 🙂сколько раз ошибался; 🙂где именно провалился. Почему фреймворк интересен, вопреки спорным результатам?  Даже на образовательных, относительно простых задачах бинарного реверс-инжиниринга модели показывают сильный разброс. GPT-5.5 значительно опережает конкурентов (а вот моя любимая кими к2 сильно отстает), особенно на сложных задачах. Все модели хуже справляются с реальными публичными CrackMe, чем со сгенерированными шаблонами. 💐Это показывает, что шаблонные задачи ещё не полностью отражают сложность реального мира и, конечно, полностью опираться на такие результаты не стоит. Главная ценность работы, кмк, в попытке превратить реверс-инжиниринг в формальную, воспроизводимую и автоматически проверяемую задачу для ИИ-агентов.  😑Особенно интересно, что бенчмарк измеряет не просто знания модели о реверс-инжиниринге, а её способность автономно действовать: строить гипотезы, выбирать инструменты, проверять результаты, менять стратегию и вовремя останавливаться. Многие модели, судя по логам, находили правильное направление анализа, но не успевали превратить его в рабочий ответ. Читаем! Тырим идею себе в ресеч, улучшаем, разрываем индустрию! Все! 🔨
339
17
Куда движется AI-assisted development? Иногда ловлю себя на мысли 🤯, что в вайбкодинге как будто чего-то не хватает. Не то чтоб какого-то формального подхода, а может какого-то слоя между “накидай фичу” и “давай вместе подумаем как инженерно это делать нормально и красивенько”. 🏢 А потом идешь гуглить — и оказывается, что кто-то уже это придумал и опубликовал такой скилл. Идея репозитория, который мы сейчас обсудим, очень простая, но кажется супер важной, - готовые workflow для агента. Например: 😑 /tdd — заставляет агента работать через test-driven development 😑 /grill-me — буквально допрашивает тебя по архитектуре и требованиям (не забалуешь! Да и агент не забалует потом)) 😑 /to-prd — превращает обсуждение в нормальный PRD 😑 /to-issues — дробит задачу на управляемые части 😑 /triage — помогает системно разбирать баги (актуалочка, мы же тут безопасники с вами) 😑 /design-an-interface — генерирует варианты API/interface design Некоторые скиллы мне даже в голову не приходили как отдельная сущность. Опять жаль, что не я! Читаю реализацию и думаю: «Ну да… то, что доктор прописал! Забираю». Не хватает зачастую инструментов, которые помогают удерживать архитектуру, контекст, декомпозицию, инженерную аккуратность внутри навайбкоженого хаоса. Нужна новая система мышления, заточенная под АИ. И вот первые шаги! 🐕 Пользуемся, вдохновляемся! Все! 😌
348
18
Обзор на обзор, о дивный новый мир! Читаем «How far have we been on the path of LLM-enhanced vulnerability detection» Авторы собрали почти 50 работ от топовых топов типа USENIX Security, NDSS, CCS, IEEE S&P, ICSE, FSE, ASE и др. и проанализировали, как близко мы подобрались к анализу кода с помощью LLM (не просто закинул функцию в 50 строк, а прям мощные репозитории в миллионы строк кода, где черт ногу сломит, а злоумышленник бэкдор оставит). 🚶‍♂️ Сейчас формируется целый отдельный класс гибридных секьюрити-систем, где LLM становятся semantic/reasoning слоем поверх классических методов анализа. ‼️ Поверх! Статья честно показывает, что LLM пока не заменяют традиционные подходы. В одном из приведённых исследований средняя точность моделей в задачах поиска и объяснения уязвимостей составляет около 62.8%, что неплохо, но явно недостаточно. Именно поэтому наиболее перспективными выглядят гибридные подходы (static analysis + LLM, fuzzing + LLM, symbolic execution + LLM). Практически все наиболее успешные работы строятся именно вокруг +- такой архитектуры. Особенно интересно выглядит направление LLM-guided fuzzing. В обзоре рассматриваются TitanFuzz, FuzzGPT , DFUZZ, KernelGPT, и ещё целый ряд систем, использующих LLM для генерации сидов, понимания сисколов и тд и тп. 🕸 Многие из этих инструментов показывают заметный рост покрытия и находят новенькие уязвимости. Некоторые работы сообщают о десятках найденных зеродэев и CVE. Ещё один важный тренд — использование LLM как механизма понимания семантики (в целом, тут не брейксру). Но это особенно важно для поиска логических уязвимостей, где сигнатурный анализ традиционно работает плохо. 🤜 В этом направлении особенно выделяются работы вроде GPTScan, где LLM фактически помогают системе понимать намерения и семантику кода, а не просто искать шаблоны. Интересно и то, что LLM начинают проникать уже, например, в binary анализ. В статье разбирается работа LATTE, использующая LLM для static binary taint analysis 🆒. Авторы смогли обнаружить десятки неизвестных багов, часть из которых получила CVE. В целом статья производит ощущение точки перелома. 😎Кажется, что анализ кода постепенно движется к новому стеку: semantic-aware static analysis, reasoning-driven fuzzing, automated specification understanding и hybrid symbolic/neural pipelines. ✅ Лично я голосую за стек CPG + GNN + graph DB + LLM, хотя в обзоре про него почти ничего нет. А ты? Все! ☹️
808
19
И кто мы такие, чтоб пропустить WEF “Empowering Defenders: AI for Cybersecurity (2026)” Читаем интересное тут, но сначала коротко о главном! 👇 Кибербезопасность окончательно проиграла в скорости и теперь вынуждена догонять ИИ. Раньше атака была ремеслом, целой наукой, чутьем к слабым местам. Нужно было время, экспертиза, ручная работа, а сейчас что? Сейчас это пайплайн. Генерация фишинга, поиск уязвимостей, написание эксплойтов — всё автоматизируется и масштабируется почти бесплатно даже нубом. В документе это формулируется аккуратно, но по факту означает лишь то, что атаки перешли в режим machine speed, а защита осталась в режиме человека (да. нам все еще нужен сон). Зато с другой стороны, например, расследование инцидента, которое раньше занимало недели, сжимается до часов. Машина строит гипотезы, подтягивает нужные данные, сама проверяет версии. Человек остаётся скорее в роли наблюдателя и валидатора, чем исполнителя. О рисках такого характера использования ИИ мы уже ранее говорили. Другой интересный кейс — переход детекции атак от технических признаков к анализу поведения и даже психологии 🔥 Фишинг ловят не по домену или сигнатуре, а по тому, как письмо пытается на тебя давить ❤️ (срочность, авторитет, манипуляция). Это довольно тревожный сигнал — атакующие давно играют в когнитивные уязвимости человека, и защита уже вынуждена делать то же самое. ❤️Но самый радикальный момент — любимый agentic AI. Системы, которые блокируют, изолируют, принимают решения тревожат наши умы и сердца уже второй год. Документ осторожно говорит про уровни автономности, но по сути это вопрос, в какой момент ты готов отдать контроль машине. Кроме того, чрезмерное доверие к AI ведёт к деградации человеческой экспертизы и ложному чувству безопасности. 😱 И это, пожалуй, самая важная мысль во всём документе. Потому что технические проблемы решаемы, а вот потеря способности думать?.. 🐔 💓 Есть ещё один слой, который читается между строк (правда, мне везде читается, тк автоматизация SOC - моя голубая мечта). Вся индустрия постепенно приходит к тому, что классическая модель SOC (люди + алерты) просто не масштабируется. Объём сигналов, скорость событий, сложность инфраструктуры превышают человеческие возможности (я считаю, уже лет 10 как превышают, бедный сок 1 линии). И здесь, наконец, AI не улучшает систему — он её заменяет. Человек остаётся только там, где цена ошибки слишком высока или решение необратимо. Парадокс 2026 года Чтобы успевать за атаками, нужно увеличивать автономность защиты. Но чем больше автономности, тем выше риск, что система сама станет источником проблемы. ✅Ошибка, галлюцинация, неправильная цель — и у тебя автоматизированный инцидент на масштабе всей инфраструктуры. В итоге складывается довольно чёткая картина будущего. 🩻 Кибербезопасность преврчащается в систему взаимодействующих агентов. Одни ищут угрозы, другие их интерпретируют, третьи реагируют, четвертые проверяют, пятые пишут отчет и так далее. Всё это работает почти без участия человека, на уровне постоянного фонового процесса. Что-то вроде иммунной системы, только цифровой. 🔺 Где провести границу между скоростью и контролем, между эффективностью и управляемостью? 🫶 Да и вообще если читать документ не как обзор, а как роадмэп для ресёрча, то он довольно чётко подсвечивает, куда реально стоит инвестировать усилия. Хотите поделюсь? Все 😶‍🌫️
326
20
Обзорчик репозитория! Как перенести multi-agent AI в OpenCode Opencode-power-pack — плагин для OpenCode, который портирует на
Обзорчик репозитория! Как перенести multi-agent AI в OpenCode Opencode-power-pack — плагин для OpenCode, который портирует набор workflow-ориентированных AI-скиллов из экосистемы Anthropic (в частности, Claude Code) в формат, нативно поддерживаемый OpenCode. 😏 Ключевая задача репозитория заключается в том, чтобы сохранить методологию мулутиагентного воркфлоу, устранив зависимость от Claude Code-специфичных механизмов (commands/, agents/), которые не работают напрямую в OpenCode. Скажи, зачем я жду звонка, зачем пустые облака? Репозиторий переписывает воркфлоу в формат SKILL.md, делая их: 👾 исполняемыми в OpenCode 👾 независимыми от Claude runtime По сути, это портируемый слой AI-оркестрации, включающий: 👾 multi-agent workflows 👾 staged reasoning pipelines 👾 adversarial review patterns 👾 строго заданную структуру (phases, checks, PoC и т.д.) Основные категории скиллов Review 🤪 code-review 🍄параллельные ревьюеры 🍄cross-check результатов 🍄воспроизводимые сценарии 🤪 security-review 🍄 OWASP-категоризация 🍄 3-stage filtering 🍄обязательный PoC для каждой находки Design 🤪frontend-design 🍄генерация UI без AI-стиля 🍄 production-ready подход Authoring 🤪 mcp-builder 🍄генерация MCP-серверов 🤪skill-creator 🍄 создание новых SKILL.md с progressive disclosure И многие другие! В пакете есть дополнительные скиллы для разработки, анализа кода и управления проектной памятью. Модель исполнения 1. Пользователь вызывает команду: /code-review 2. OpenCode подставляет содержимое: commands/code-review.md 3. Модель получает полный воркфооу как пррмпт — дисциплинированный промпт инжениринг высокого уровня. 🏃‍♂ 👏 По сути opencode-power-pack — это адаптер сложных AI-инженерных практик (Anthropic-style) в минималистичную модель исполнения OpenCode. Он сохраняет продвинутые воркфлоу, убирает зависимость от Claude Code, превращает мультиагентную логику в воспроизводимые промпт-пайплайны и это только k_top функционала. Иди смотреть и бери на карандаш! Добавлю инфографику от гпт (грех было не побаловаться)! Все 👾
289