Искусство. Код... ИИ?

رفتن به کانال در Telegram

Канал о прекрасном и не очень, вокруг кода, искуственного интеллекта, и их безопасности. Навигация по каналу: https://t.me/art_code_ai/105

نمایش بیشتر

روسيا401 206 فناوری و برنامه‌ها47 175

598

مشترکین

اطلاعاتی وجود ندارد24 ساعت

اطلاعاتی وجود ندارد7 روز

+2430 روز

657

نمایش های پست

~ 17124 ساعت

~ 18148 ساعت

109.87%

نرخ مشارکت

اطلاعاتی وجود ندارد

پست های در روز

Ads index

beta

آرشیو پست ها

601

🧩 Мой набор кастомных агентских скиллов Чтобы больше не спамить сюда своими прочими агентскими скиллами, которые использую в работе, завёл под них отдельный репозиторий. Пока скинул туда 4 скилла для ресёрчей и проработки идей: • vibe-research — скилл из предыдущего поста; • scamper — трансформация идей по методике SCAMPER; • explore — обобщенная под произвольные темы ресёрчей версия /opsx-explore из OpenSpec; • triz-solver — ресёрч через ТРИЗ. Позднее буду туда докидывать также и скиллы для разработки и прочих смежных задач R&D (сейчас они гвоздями прибиты к моим воркфлоу в Qoder'е, как дойдут руки отвязать — так сразу).

601

🎲 Вайб... ресёрчинг? Вдохновленный OpenSpec'овским opsx-explore, сделал его вайбовую версию для ненапряжных ресёрчей по вечерам, когда ~~совсем нехрен делать~~ хочется прекрасного, а думать лень. Воркфлоу предельно простой: 1️⃣ Обозначаете общую тема ресёрча. 2️⃣ ИИ собирает релевантную инфу в сети, обогащает ей контекст, предлагает варианты, и задает уточняющие вопросы. 3️⃣ Отвечаете на вопросы, корректируете текущий вектор мыси на древе, если нужно. 4️⃣ Всё повторяется с шага 2, пока не надоест. Работает, как часы ☺️ Воткнул его в QoderWork (на скрине, рекомендую — реально хороший агент для повседневных задач, с песочницей и тулами). В комменты скину SKILL.md, в нём стоит поправить имена тулов для поиска в сети и скачивания контента, если захочется использовать в другом агенте. В теории, ничего не мешает и просто воткнуть текст оттуда в промпт условного ChatGPT, если что.

601

✨ Agentity: самомодифицирующийся ИИ-агент В эфире рубрика «потому что могу» 🦄 Набросал игрушечного (~350 строк кода) ИИ-агента для решения примерно всех задач. Ну... в теории 😬 Из коробки эта кроха умеет только читать собственный код, модифицировать его (преимущественно — добавляя себе реализации новых инструментов, необходимых для достижения цели), и рестартовать с сохранением контекста, чтобы подтягивались сделанные изменения. В наличие также принудительные проверки всех патчей линтером и тайпчекером, а также режим самопочинки, если крохе удастся докодиться до исключений в рантайме. С задачами «на смекалочку» хорошо работает только с большими моделями, типа gpt-5.2, deepseek и т.п. Увы, но их младшие локальные братья зачастую просто не вдупляют, как им могут помочь доступные на старте три инструмента, несмотря на всё, написанное в системном промпте. Тут и сам промпт оптимизировать надо, и структурированный вывод прикручивать (SGR здесь прям напрашивался, но сразу сделать было лень), и нормальный планировщик запиливать. Ну, или дотошно расписывать в формулировке задачи, как связана модификация кода агента с достижением поставленной цели. Никаких песочниц или ограничений прав — все по-суровому (на всякий случай предупреждаю). Ну и пока нормально работает только с задачами, чье решение влезает в одно контекстное окно — ни сжатия/суммаризации контекста, ни суб-агентов, здесь не предусмотрено. Но, блин, оно работает 🎉 А лежит — здесь. В комменты скину логи с примерами работы.

601

Как разработчику быстро углубиться в тему LLM? Часть 2 Часть 1 2. Механизм внимания (self-attention) ❓Вопрос на разминку: как во фразе «Data visualization empowers users to» понять, что слово empowers относится к visualization? В трансформерах за такие зависимости отвечают механизмы внимания. Сами трансформеры разберём в следующей части, а пока достаточно знать следующее: это нейросеть для работы с последовательностями (текст, аудио, ДНК и т.д.), которая обновляет представление каждого токена слоями. В обучении/обработке готовой последовательности это делается параллельно по всем токенам; в генерации текста новые токены добавляются шаг за шагом (autoregressive), но внутри каждого шага операции параллельные. Ключевая операция внутри слоя — self-attention: способ «взвесить» для каждого токена, какие другие токены в контексте ему сейчас важны, и собрать из них непосредственно контекст. Для каждого токена линейными преобразованиями вычисляются три вектора: • Query (Q): «что я сейчас ищу в контексте?» • Key (K): «по каким признакам меня можно найти/со мной сопоставиться?» • Value (V): «какую информацию я передаю, если на меня "посмотрят"?» Как считается self-attention, по шагам: 1️⃣ Dot product (оценка совместимости): для каждого токена берём его Query и считаем скалярные произведения со всеми Key остальных токенов. Получается матрица «оценок внимания» размера n×n (n — длина последовательности). 2️⃣ Scaling (масштабирование): оценки делят на √dₖ, где √dₖ — размерность Key/Query в одной голове внимания. Зачем это нужно: без деления разброс значений Q·Kᵀ растёт с dₖ softmax начинает «насыщаться» (почти 0/1), и обучение/градиенты становятся менее стабильными. 3️⃣ Mask (маскирование): перед softmax часто запрещают некоторые связи, выставляя им очень большие отрицательные числа (эквивалент −∞), чтобы после него они получили почти нулевой вес. Два самых частых случая: • padding mask: игнорировать токены-паддинги; • causal mask: в генерации текста запретить смотреть в будущее (токен i видит только позиции ≤ i). 4️⃣ Softmax (и иногда dropout): превращает оценки в нормированные веса (распределение внимания), которые суммируются в 1 по строке — для каждого «смотрящего» токена. 5️⃣ Взвешенная сумма Values: веса умножаются на V и суммируются — получаем контекстный вектор для каждого токена: он содержит информацию о других токенах пропорционально их важности. Формально: Attention(Q,K,V) = softmax(Q·Kᵀ / √dₖ) · V, где T — транспонирование (чтобы Q·Kᵀ дало матрицу n×n). ❓Зачем вниманию несколько голов (multi-head)? Одна голова — это один «взгляд» на последовательность: свои матрицы проекций для Q/K/V и свои веса внимания. Multi-head attention делает такие «взгляды» параллельно: каждая голова считает attention независимо, затем выходы голов конкатенируются и проходят через выходную линейную проекцию (W^O). Практический смысл: разные головы могут подхватывать разные типы зависимостей (локальные, дальние, синтаксические/семантические шаблоны), и итоговый контекст получается богаче. Наивная реализация self-attention опирается на матрицу n×n, поэтому вычислительная природа операции квадратичная по длине контекста. По памяти квадрат возникает, когда мы явно материализуем/храним attention-матрицу (веса). В продакшене часто используют оптимизированные подходы (например, FlashAttention), которые уменьшают пиковую память за счёт того, что не пишут всю матрицу внимания n×n в глобальную память. В autoregressive inference LLM обычно кэшируют K и V для уже сгенерированных токенов (KV-cache), чтобы не пересчитывать их на каждом шаге. Этот кэш растёт линейно с длиной контекста и на больших окнах часто становится главным потребителем памяти на инференсе. Как прикинуть потребление памяти KV-cache для заданной модели и длины контекста хорошо описано здесь. ✍️ На правах домашнего задания стоит изучить следующие материалы: • The Annotated Transformer • Attention? Attention! • FlashAttention • Краткая история механизма внимания в NLP ... и обязательно поиграться с левой частью интерактивной визуализации 🦄

601

Пусть на этом канале будет своя, особенная валентинка 🤗 Код сложил сюда. P.S: Чуть доработал прошлогоднюю консольную версию, да 🙈

601

💻Средства разработки ИИ-агентов на Go Что делать, если, устав обкладывать свой Python-код линтерами, тайпчекерами и избыточными тестами, решил свалить на Go, а разрабатывать ИИ-агентов всё ещё нужно? Ниже — подборка библиотек и фреймворков, которые помогут продолжить этим заниматься на Go. Агентные фреймворки (на выбор): 🌟 LangChainGo (tmc/langchaingo) Go-порт LangChain с упором на композицию: цепочки, агенты, память, инструменты и интеграции для LLM-приложений. Умеет в агенты/инструменты/память; поддержку нескольких LLM/провайдеров; векторные хранилища. 🌟 Eino (cloudwego/eino) Go-first фреймворк для LLM/AI-приложений, явно ориентированный на Go-конвенции и вдохновлённый LangChain и другими подходами. В наличии композиция пайплайнов (графы/цепочки); инструменты и агентные workflow блоки; экосистемные интеграции; визуальный дебаг/инспекция узлов и оркестрации. 🌟 tRPC-Agent-Go (trpc-group/trpc-agent-go) Ещё один фреймворк для построения агентных систем на Go, с фокусом на LLM+tools. Поддерживает автономные/полуавтономные агенты; планировщики (в т. ч. иерархические); долгоживущую память/состояние; телеметрию; управление исполнением инструментов с возможностью внешнего выполнения. 🌟 Blades (go-kratos/blades) Нишевый и минималистичный, позиционируется как мультимодальный агентный фреймворк на Go, с поддержкой кастомных моделей, инструментов, памяти и миддлвари. Подойдет тем, кто плотно сидит на kratos. Библиотеки: 🌟MCP Go SDK (modelcontextprotocol/go-sdk) Официальный Go SDK для протокола интеграции LLM‑приложений с внешними инструментами и источниками данных. Поддерживает примерно всё, что требуется для реализация клиентов и серверов MCP. 🌟tiktoken-go (pkoukk/tiktoken-go) Порт OpenAI tiktoken на Go для быстрых BPE‑токенизаций и подсчёта токенов: оценка стоимости, контроль лимитов контекста, чанкинг документов и предотвращение отказов по превышению токенов. Официальные SDK: 🌟OpenAI Go SDK (openai/openai-go) 🌟Go OpenAI (sashabaranov/go-openai) 🌟Anthropic Go SDK (anthropics/anthropic-sdk-go) 🌟Google Gen AI Go SDK (googleapis/go-genai) 🌟AWS SDK for Go v2: Bedrock (github.com/aws/aws-sdk-go-v2) 🌟Azure OpenAI extensions module for Go (Azure/azure-sdk-for-go, azopenai) Клиенты векторных БД: 🌟Qdrant Go Client (qdrant/go-client) 🌟Pinecone Go SDK (pinecone-io/go-pinecone) 🌟Weaviate Go Client (weaviate/weaviate-go-client) 🌟pgvector-go (pgvector/pgvector-go) Локальный инференс: 🌟 Go llama.cpp bindings (go-skynet/go-llama.cpp) Высокоуровневые биндинги для Go к llama.cpp — высокопроизводительной библиотеке с открытым исходным кодом, написанной на плюсах, и предназначенной для локального инференса LLM. 🌟Ollama (ollama/ollama) Легковесная, расширяемая высокоуровневая оболочка llama.cpp для создания и запуска языковых моделей локально, хорошо интегрирующаяся с Go-проектами. 🌟LocalAI (mudler/LocalAI) Альтернатива, дающая «drop-in replacement» REST API, совместимый с OpenAI‑подобными спецификациями. Поддерживает мультимодальность; агентную совместимость через Open Responses API; и Anthropic API. А ещё больше подобного — здесь. ⚠ TL;DR: Просто сохраняем в избранное ☺️

601

💻 Уязвимость в cgo (CVE-2025-61732): и снова парсеры В Go 1.25.7 и 1.24.13 разработчики устранили пару уязвимостей, одна из которых оказалась на мою любимую парсерную тему ☺️ Уязвимость была в стандартном инструменте cmd/cgo — компоненте Go, позволяющем Go-коду взаимодействовать с кодом на C. Из-за расхождений в правилах разбора комментариев между компиляторами Go и C атакующий мог скрыть фрагменты C-кода внутри комментариев. Такие фрагменты игнорировались компилятором Go, но воспринимались как исполняемый код компилятором C, встраиваемым в итоговый бинарник. Уязвимость проявлялась в механизме обработки doc-комментариев в cgo. Ранее cgo включал (и весьма криво) пользовательские комментарии из исходников Go в генерируемые заголовочные файлы для сишки, из-за чего было возможно нарушить границы комментария в выходном C-коде и внедрить туда выполняемые строки. Например, вставить символы закрытия/открытия комментария */ и /* внутри строки, начинающейся как комментарий Go. В Go такая строка полностью игнорируется (как комментарий //), но в сгенерированном коде Си она была бы преобразована в активный код. Выглядит это могло как-то так:

// */ system("rm -rf /"); /* 
//export Func1
func Func1() {}

Здесь строка с // */ system("rm -rf /"); /* интерпретируется Go как комментарий и полностью пропускается. Однако утилита cgo при генерации C-кода убирала префикс //, либо заменяла его на /* (видимо для того, чтобы объединять в один большой многострочный коммент несколько однострочных). В итоге в C-код здесь попадет скрытая от гошных SAST'ов команда system("rm -rf /");. Судя по всему, реальные сценарии атаки на эту уязвимость крутятся где-то вокруг цепочки поставок и бэкдоринга компонентов-зависимостей. Исправили это разработчики весьма радикально: теперь doc-комментарии тупо не собираются. Что в целом понятно, поскольку согласование грамматик двух здоровых языков, в общем случае — задача сомнительная и неблагодарная. Хотя конкретно этот кейс всё же можно было относительно легко и корректно пофиксить, не жертвуя при этом функциональностью. ⚠ TL;DR: В свежих версиях Go пофикисили парсерную уязвимость в cgo, позволявшую внедрить в генерируемые заголовочные C-файлы произвольный код через гошные комментарии.

601

🤝 Пара интересных RCE в n8n Похоже, за n8n взялись всерьез (ну... неудивительно). Если дело так пойдет и дальше, придется заводить под их уязвимости отдельную рубрику. Разбор упомянутых CVE в деталях можно почитать здесь, «из первых рук», так сказать. В чем суть, вкратце. Обе RCE — ответочка от jFrog на уже реализованные разработчиками n8n меры по устранению ранее обнаруженных уязвимостей, которые в итоге и привели к новым CVE-2026-1470 и CVE-2026-0863. Дело в том, что когда возможность выполнения пользователями <относительно> произвольного кода становится официальной фичей, вопрос безопасной реализации подобной функциональности слегка усложняется. Разработчики n8n пошли по пути синтаксической валидации пользовательского кода на уровне AST в обоих случаях (JavaScript, Python): код разбирается в синтаксическое дерево, дерево обходится визитором, осуществляющим детектирование потенциально опасных узлов. И это — фиговое решение, как минимум по двум причинам. 1️⃣ Во-первых, по своей сути — это контроль по черным спискам. Собственно, патчи к этим уязвимостям (раз, два) разработчики свели к добавлению в эти списки техник атак, продемонстрированных ресерчерами jFrog. Сколько ещё вариантов поиграться с синтаксисом этих языков для подобных RCE существует прямо сейчас — думаю, jFrog'и скоро расскажут. А, как скоро в новых версиях языков появятся конструкции, не предусмотренные в черных списках n8n, но позволяющие выстроить гаджеты для вот таких RCE — покажет время. 2️⃣ Во-вторых, проверки на уровне AST — это синтаксическая валидация. У всех языков, помимо синтаксиса, есть ещё и семантика. А у динамических языков (коими являются, и JavaScript, и Python), некоторая её часть является сущностью времени выполнения. И эта часть НЕ МОЖЕТ быть эффективно проанализирована статическими проходами по синтаксическому представлению. Иными словами, даже белые списки (исходя из того, что в них было бы необходимо разрешить в свете соответствующих фич n8n) здесь не позволили бы закрыть все потенциальные проблемы. 🤓 Как правильно работать с такими кейсами? Простых решений, здесь, увы можно не ожидать. По возрастанию ~~упоротости~~ трудозатрат на реализацию: 1. Если есть возможность влиять на язык, используемый для скриптов, то взять ограниченный валидацией по белым спискам (разрешенные синтаксические конструкции, пространства имен и типы) статический язык с сильной типизацией. Из известных мне языков на эту роль лучше всего подходит C# Scripting. 2. На этапе прохода по AST инструментировать код проверками на допустимость операций, которые будут осуществляться в рантайме, во время выполнения скрипта. В идеале библиотека рантайма и используемые сторонние библиотеки также должны быть инструментированы (реализацию можно подсмотреть в OpenTelemetry, например). В пределе — это приведет к разработке собственного RASP, заточенного под фичи скриптинга конкретного проекта. 3. Использовать собственноручно пропатченные интерпретаторы, допускающие только разрешенные синтаксис и семантику. Настолько сложно, что в большинстве случаев нецелесообразно. Ну и, безотносительно способа первичной защиты: выполнять все пользовательские скрипты в изолированных контейнерах: как минимум — в Docker, как рациональный максимум — в условном FireCracker'е. ⚠ TL;DR: разработчики n8n думают, что устранили ещё две RCE, но есть нюанс. И простого способа его обойти у них нет.

601

🪲 Насколько все плохо с безопасностью в Gen-AI коде? В октябрьском Veracode 2025 GenAI Code Security Report исследователи анализировали более 80 задач и более 100 моделей LLM и установили, что примерно 45% AI-генерированного кода содержат уязвимости, включающие слабые места из OWASP Top 10. И это только те, которые могут быть детектированы их SAST'ом. В декабре 2025 исследование по vibe-кодингу показало, что в продвинутых сценариях реального программирования — когда агенты решали задачи из репозиториев GitHub — около 82–90 % рабочих решений всё равно содержали уязвимости, даже если код был функционально корректным. Сентябрьское исследование от Cloud Security Alliance указывают на ещё более высокие оценки — до 62 % AI-генерированного кода демонстрируют известные уязвимости или конструктивные дефекты безопасности. И, в свете этого, играет совсем другими красками, вышедшее буквально на днях в Science исследование Who is using AI to code? По оценке его авторов, к концу 2024 г. ИИ помог создать примерно 29% всех новых функций, написанных разработчиками из США. Доля ИИ-поддержанных функций варьируется по регионам: • США ~29%, • Германия ~23%, • Франция ~24%, • Индия ~20%, • Россия ~15%, • Китай ~12%. И это только на GitHub и только в проектах на Python... Забавно получается, если объединить статистику этого этих исследования со всеми остальными, не правда ли? 🤩

601

Трейд-оффы современных языков программирования Надеюсь, никакой ящик Пандоры я этим постом не открою... 🫣 Для контекста:

Rust неплохой язык, на нём интересно писать… пет-проекты в соло и то, для чего раньше стоило бы взять C/C++. Для наших прототипов и нетребовательного прода — всё ещё Python, для всего остального — Go.

Последнее время плотно занимаюсь оценкой фичей безопасности, которые предлагают те или иные языки программирования и экосистемы. Пост (точнее — статью) об этом попозже обязательно опубликую, а пока захотелось поделиться побочным результатом этого ресерча: сравнением популярных языков в рамках «быстро-дешево-безопасно». Для каждого языка сформулировал оценку по 10-бальной шкале, относительно трех критериев: • Совокупная стоимость. Интегральная оценка по всем видам затрат, к которым приводит разработка на этом языке: оптимальная численность и стоимость команд, затраты на тестирование, инфру и поддержку. • Скорость. По сути — временная стоимость стори-поинта в проекте медианной сложности (веб, энтерпрайз, облака). • Безопасность. Уровень безопасности, гарантируемый стандартной поставкой языка и его рантайма. Проставляя оценки по первым двум критериям, опирался на материалы, наиболее интересные из которых, приведены ниже. Там, где не получалось опираться, давал субъективную оценку, исходя из собственного опыта. Оценку по третьему критерию брал из упомянутого выше ресерча, основанного большей частью на аналитике по спекам и докам языков, и их экосистем, и CVE, которыми страдали написанные на них проекты. Там, где семейство языков объединено единой экосистемой (.NET, JVM, Node) рассматривал общие для всего семейства свойства, т.к. глубоко убежден, что хотя конкретные языки и могут отличаться друг от друга по заданным критериям, определяющим фактором здесь остается все же их экосистема. Затем, с помощью полученных оценок, plotly.js и ~~такой-то матери~~ ChatGPT, сделал визуализацию всего этого, скрины которой вы видите выше. Для желающих покрутить 3D-сцену мышкой, скину в комментах HTML. Примечательно то, что никак не подгоняя изначально данные оценки, и построив по ним на диаграммах Pareto Front (по всем трем критериям), получил ровно три языка, упомянутые в цитате из своих новогодних инсайтов. Pareto Front в данном случае обозначает языки, представляющие все рационально допустимые компромиссы при выборе стека (говоря иными словами — остальные нет смысла учитывать при выборе по этим критериям, т.к. результат будет заведомо хуже). Разумеется, когда, например, есть готовая и сработавшаяся команда, особенно с уже существующей и стабильной кодовой базой, критерии и способ их подсчета должны быть уже слегка другие. Так что, эти диаграммы скорее о том, на какие языки стоит ориентироваться при старте новых проектов с абсолютного нуля, как минимум. 📰 Материалы, помогавшие делать оценку (заслуживающие вашего внимания): • Top 8 Most Demanded Programming Languages • The 9 cost factors • What Is the Most Secure Coding Language? • 2025 Stack Overflow Developer Survey • Which Programming Language Has the Most Vulnerabilities? ⚠ TL;DR: в любой непонятной ситуации используйте Python, Go или Rust. В любой понятной — выбирайте язык с умом, под задачу, команду и предметную область. C/C++ не используйте, если можете 🙂

601

🤝 По следам Ni8mare перед Рождеством Самой громкой CVE за каникулы стала, пожалуй, брендово-трендовая-и-вот-это-всё CVE-2026-21858 aka Ni8mare, получившая CVSS 10.0 благодаря возможности развития атаки на неё до полноценного RCE. Саму уязвимость не разобрал разве что только ленивый <автор этого канала>. Вот хороший разбор с красивыми картинками и примерами кода, повторяться, теперь уже, смысла нет. Причина этой уязвимости, тут же названная «Content-Type Confusion» теми, кому совершенно не жаль составителей таксономий, заключается в ошибках обработки HTTP-запросов с различными Content-Type заголовками в webhook-эндпоинтах n8n: сервер необоснованно доверяет данным из req.body.files, даже когда заголовок Content-Type не указывает на multipart/form-data, что позволяет атакующему подменить содержание и структуру тела запроса. Это приводит к тому, что функции обработки считают произвольно сформированные данные «загруженными файлами» и используют их для чтения файлов на сервере. Используя это и функциональность прочих модулей, доступных в n8n, атакующий может развить атаку вплоть до RCE. Цепляет в уязвимости то, что здесь явно теряется соблюдение в коде границы доверия, но настолько неявным способом, что заметить это, просто читая код глазами или SAST'ом — не так уж и просто. Вот близкий к оригиналу псевдокод, иллюстрирующий уязвимость этого типа:

// Middleware: разбор тела запроса в вебхуке
function parseRequestBody(req) {
    if (req.headers['content-type'].startsWith('multipart/form-data')) {
        // Парсим форму и файлы (через, например, Formidable)
        req.body = parseFormData(req);  // сформирует req.body.files для файлов
    } else {
        // Парсим JSON или другие типы как обычное тело
        req.body = parseBody(req);  // напрямую десериализует тело в req.body
    }
}
// Обработчик webhook формы (уязвимая версия)
app.post('/form-webhook', (req, res) => {
    parseRequestBody(req);
    const result = prepareFormReturnItem(req.body);
    // ... дальнейшая обработка
});
// Функция обработки загруженных файлов
function prepareFormReturnItem(body) {
    for (const fileId in body.files) {
        // Скопировать файл из временного пути в постоянное хранилище
        copyBinaryFile(body.files[fileId].filepath, uploadDir);
    }
    // ... вернуть результат для workflow
}

Да, copyBinaryFile как бы намекает, что это потенциально опасная операция копирования файлов. Но SAST, не знающий о деталях работы Formidable, здесь даст фолз, как минимум, на ветке с multipart/form-data, а человек, проводящий триаж/ревью — вообще забьет на обе сработки, т.к. по логике — копирование файлов тут норм, ведь их исходные пути мы получаем от парсера (ведь только от парсера же, да? 😬), выполняющего здесь ещё и роль доверенного санитайзера. 🖥 Что делать разработчикам? • Структурные входные данные должны валидироваться по схеме конкретного кейса бизнес-логики, следуя принципу fail-closed, прежде, чем начнется работа с их полями (даже их валидация). • Не стоит смешивать в одном потоке выполнения несколько логических кейсов. В данном случае — следовало бы разнести по разным эндпоинтам работу с разными типами контента (облегчает задачу SAST, делает счастливыми триажеров и ревьюеров — сплошной профит). Но, если уж смешались, то п.1 должен быть корректно реализован для всех веток выполнения. • Инварианты и гарантии, предоставляемые используемыми парсерами, валидаторами и санитизаторами стоит изучить досконально. Даже в «нормальной» ветке с multipart/form-data, то, что formidable гарантирует загрузку по безопасным путям относительно options.uploadDir — нужно знать, а не предполагать. А ещё лучше — лишний раз убеждаться в этом, прежде, чем работать с полученными результатами. Почему? • Потому что, Defense in Depth через многоуровневую модель угроз никто не отменял. То, что, например, через обычную читалку файлов стало возможным вытащить .n8n/database.sqlite говорит о том, что уровней внутренних границ доверия у n8n просто не было. ⚠ TL;DR: читаем разбор Ni8mare, делаем выводы, сравниваем с написанным выше ✍️

601

Пост-мортем персонального рабочего адвент-календаря 2025 Скучно подводить итоги… с моим-то отношением ко всей этой движухе — так тем более. Ну кому интересно, какие книги я прочитал, какие проекты начал, чего достиг и сколько полимеров оставляю в уходящем году? 🤷‍♂️ Давайте лучше так: один месяц — один накрывший меня в нём (сугубо личный и никому не навязываемый) инсайт вокруг профессиональной области? Погнали. 🗓 Январь Самой приоритетной и подлежащий тщательному планированию и соблюдению сроков задачей, в любом R&D проекте, является отдых его участников. Да, вот прям в Jira или Youtrack, или хотя бы в персональном календаре. Ежедневный сон, еженедельные выходные, ежеквартальные дейоффы вокруг праздников, и пара больших отпусков в год на перезагрузку. Не отдыхаешь — не работаешь. 🗓 Февраль Главной целью любого бизнеса является системное и прогнозируемое извлечение прибыли. Главной целью любой семьи — забота друг о друге, и обеспечение целостности перед любыми внешними факторами. Это цели несовместимы. В коммерческой компании, где «мы все здесь, как одна большая семья», херовая — либо «семья», либо бизнес. 🗓 Март Наиболее востребованный скилл ближайших лет — умение доходчиво, в деталях, не теряя контекст, и не растекаясь по древу, доносить свои мысли и идеи до других людей. И не людей — тоже. 🗓 Апрель Основным инструментом любого руководителя, начиная с сеньора, которому дали на воспитание пару джунов, являются люди. Не его скиллы, опыт или майндсет. Не «проще самому сделать, чем объяснять» или «я сделаю быстрее и лучше». Если продолжаешь делать быстрее и лучше, значит руководить ими должен кто-то другой. 🗓 Май Оказывается, на весьма примитивном тайм-менеджменте, можно за неделю подготовить два неплохих часовых доклада, параллельно участвуя в организации самого мероприятия, ещё и выполняя при этом свою основную работу. И не только не сгореть, но и получить от всего этого удовольствие. 🗓 Июнь С возрастом, мы становимся заложниками своего опыта. Мозгу не нужны все эти новомодные языки программирования, технологии, фреймворки, и десятки новостей о прорывах в области ИИ ежедневно. Мозгу нужны простые ответы, укладывающиеся в уже устоявшуюся картину мира. И, если её регулярно не расшатывать, то на обочине можно оказаться, даже не заметив этого. Бродя по ранее протоптанным тропинкам на новую дорогу выйти не получится. 🗓 Июль Без инсайтов (полноценно отдыхал, да). 🗓 Август Договариваясь о сроках, умноженных на иррациональный коэффициент собственной внезапности (π, ℇ, √2 — вот это всё), совсем не лишним будет проговорить также и сроки начала работ, с поправкой на те же самые коэффициенты. 🗓 Сентябрь «Когда мир переворачивается, выигрывают те, кто первыми встают на голову» (с) Про что это — пояснять, думаю, излишне. 🗓 Октябрь Вайб-кодинг дал нам всем прекрасный шанс таки научиться писать нормальные спецификации. Было бы непростительной ошибкой этим не воспользоваться. 🗓 Ноябрь Rust неплохой язык, на нём интересно писать… пет-проекты в соло и то, для чего раньше стоило бы взять C/C++. Для наших прототипов и нетребовательного прода — всё ещё Python, для всего остального — Go. Угу, как дотнетчик это говорю, вы все правильно поняли) 🗓 Декабрь Снова без инсайтов (два больших отпуска на перезагрузку, помните?). Хотя один всё же есть: отпустив дедлайн «успеть в этом году», и работается, и отдыхается в декабре — намного спокойнее и продуктивнее. Чего вам всем и желаю 🤗 С наступающим новым годом! И до встречи в январе. ❄️

601

В Китае, на Тэнчунском научном форуме, представили доклад «Технологические прогнозы и видение будущего до 2049 года». Сам доклад охренеть, какой здоровый, но некто Руи Ма заботливо разложила его по полочкам в своем блоге. Прочесть однозначно стоит, но ценность там, не столько в визионерских тезисах самого доклада, сколько в 5 редлайнах, определяющих их суть. Если воспринимать это не как «вау, китайцы опять мечтают», а как инженерный документ о ставках, то становится чётко видно, что почти каждый пункт — это вариация одной схемы: • строим плотную инфру сенсоров/связи/вычислений, • запускаем в неё агентов/модели, • собираем обратную связь из реального мира, • замыкаем цикл оптимизации, • получаем систему, которая сама себя поддерживает, расширяет и отчасти проектирует. И тут стоит отличать здравый инженерный подход от хайповой религии. На Западе обсуждение ИИ слишком часто сваливается в: «AGI завтра всех заменит» и «давайте срочно всё остановим». У китайцев же тон другой: прогресс они считают неизбежным, поэтому ключевой вопрос — не «стоит ли», а «как это все заменеджить». Риски признаются, но трактуются как задачи управления: архитектурой, протоколами, сертификацией, ограничениями инфры.

1️⃣ Взрослые системы всегда упираются в реалии эксплуатации, а не в красивые демки.

Второй редлайн — «интеллект без тела не взрослеет». Они постоянно возвращаются к физике: роботам нужна тактильность и манипуляция, воздушной мобильности — батареи и управление трафиком, «зеркальному миру» — дешёвое построение цифровых двойников и поток реальных данных, медицине — клиническая валидация, энергии — синтез и распределение. Это хороший холодный душ для тех, кто продолжает верить, что ещё один скачок параметров решит всё. Не решит.

2️⃣ Мир слишком аналоговый, грязный и дорогой.

Третий редлайн — конвергенция. Они не мыслят «ИИ в отрыве от всего». Там всё время склеивается: связь ⇔ вычисления ⇔ энергия ⇔ материалы ⇔ автономные машины ⇔ биология и связанные с этим риски. Это неприятно для людей, которые хотят простых историй уровня «мы внедрим ИИ в процесс и станет хорошо». Нет, станет сложнее. Вероятностный слой управления, встроенный в критическую инфраструктуру, умножает поверхность атаки, резко усложняет верификацию и размывает ответственность. И это как раз то место, которое вызывает больше всего вопросов в визионерских роадмапах. Там обычно красиво рисуют «появится автономность», но редко считают цену отказа, цену ошибки и цену злоупотребления.

3️⃣ Эти цены в реальности и определяют, что будет внедрено, а что останется слайдами в докладе.

Четвёртое — «агентный интернет», как смена субъектности. Здесь явно описывается будущее, где основными активными участниками сети являются ИИ-агенты: они торгуются, планируют, согласуют, управляют ресурсами. Это выглядит логичным продолжением автоматизации, но здесь же сидит и главный риск: когда «действуют агенты», границы безопасности и доверия перестают быть вопросами периметра.

4️⃣ Они становятся вопросами протоколов взаимодействия и формальных ограничений на поведение агентов.

Наивно полагать что сегодняшние проблемы с безопасностью исчерпали весь свой потенциал. Мы просто пока не доросли до уровня, где главными дефектами являются действия агентов, а не огрехи кода или инфры. Уязвимость агентной логики... ммм, точно будет весело 🫡 И последнее — символическая дата здесь вторична. Ценность доклада не в точности прогнозов (она наверняка будет околонулевая), а в том, что он показывает именно инженерную картину мира: не «сделаем прорыв», а «соберём систему из взаимодополняющих элементов».

5️⃣ По-другому — большие технологические эпохи и не собираются.

⚠ TL;DR: главная мысль доклада не в конкретных фантазиях про 2049-й, а в одной скучной, но здравой идее: ИИ — не продукт и не философия, а слой управления сложными системами, который обязан приземляться на физический мир (энергия, материалы, связь, и т.п) с четкой оценкой рисков. Иначе, он так и останется лишь дорогой игрушкой для красивых презентаций.

601

🤖 AI Code in the Wild: «хотели, как лучше...» AI-кодер — будто «стажёр-всезнайка на стероидах»: пишет много и быстро то, что выглядит аккуратно и эстетично. А потом внезапно выясняется, что он по всему GitHub размножил один и тот же уязвимый паттерн... Авторы опубликованного на днях исследования AI Code in the Wild собрали историю коммитов в топ-1000 репозиториев GitHub за 2022–2025 и отдельно 7000+ изменений кода, связанных с CVE, и на этом попытались измерить, где именно AI уже «живёт» и как он влияет на уязвимости. Что выяснили: • AI уже в кодовой базе, в заметной доле, но присутствует неравномерно. Он особенно любит документацию (~38.6%), заметно залезает в бизнес-логику (~34.5%), а вот в конфигах/данных его уши торчат сильно реже (~9.65%) — видимо, туда его пока не особо пускают, уж больно легко сделать нехорошо продакшену парой токенов. • У него есть «любимые» классы уязвимостей — и это даже не про сложную бизнес-логику. В топе — ошибки обработки входных данных (62.7%) и криптографические продолбы (20.6%), оформленные настолько правдоподобно, что не всегда получается сходу их выявить. То есть AI отнюдь не изобретает новые баги, он старательно штампует узкий набор небезопасных идиом, мимикрируя их под нормально выглядящий код. • По серьезности (CVSS) AI-уязвимости примерно такие же, как человеческие… но чаще торчат в сеть. По распределению severity статистически авторы большой разницы не нашли (медианы близки), но вот по векторам атак — уязвимости, внесённые AI, слегка чаще оказываются эксплуатируемыми по сети (86.8% против 80.8% у «человеческих»). • Самый неприятный вывод: AI-индуцированные уязвимости могут размножаться, как шаблоны. Авторы прямо говорят: они видят почти идентичные небезопасные шаблоны в разных проектах, и это больше похоже на эффект общих моделей, чем общих мейнтейнеров. Почему это заслуживает внимания: Исследование аккуратно подводит к идее: в AI-эпоху «доверие» надо переносить с ревью одного PR на весь пайплайн — потому что скорость генерации AI-кода никак не масштабирует внимательность нашего брата. И если AI системно выдает повторяемые типы ошибок, их можно ловить правилами/типами/ограничениями так же системно, не надеясь на героизм ревьюеров. Btw, описанная ими в статье методика классификации авторства кода (AI или человек), заслуживает отдельного внимания: ансамбль признаков и обучающая выборка из реального человеческого и синтетического AI кода, для получения вероятностной оценки. ⚠ TL;DR: Это не очередная «AI иногда пишет небезопасно». Авторы берут топ-1000 репозиториев GitHub и тысячи CVE-патчей, детектят AI-код в реальных коммитах, и дальше показывают, что у AI есть повторяемые «любимые» ошибки (особенно в обработке входных данных и криптографии), и они имеют тенденцию размазываться по экосистеме как шаблоны, за счет использования одних и тех же моделей. #AppSec #SecureCoding #AI #LLM #DevSecOps

601

Архитектура безопасности ИИ-агентов в Google Chrome На фоне добавления в Chrome интеграции с Gemini, и в предверие выхода agentic-фич в браузере, команда Google Security разродилась любопытной статьей на тему их видения архитектуры безопасности всего этого хозяйства. Основной угрозой для браузера его авторы [заслуженно] считают косвенные промпт-инъекции (indirect prompt injection, IPI), которым оказались подвержены, и недавно вышедшие Comet с Atlas'ом, и упомянутая вышедшая ранее интеграция Chrome с Gemini и бог его знает, какие ещё браузеры (подробнее почитать об этом можно, например, тут: [1], [2], [3]). Для борьбы с IPI они предлагают простую (тем и привлекающую) архитектуру, в рамках которой браузер получает отдельную модель-критика — защитный слой, который оценивает каждое действие агента ещё до того, как оно достигнет реального интерфейса. Критик намеренно изолирован от внешнего контента и анализирует только параметры будущего шага, тем самым исключая возможность влияния внешнего контента на его решения. Чтобы агент не превратился в универсальный механизм доступа ко всему, что видит браузер, вводится концепция «Origin Sets»: агент заранее привязывается к ограниченному набору ориджинов (в терминах, близких к SOP), релевантных решаемой задаче. Причём для каждого устанавливается собственный уровень взаимодействия: чтение, или чтение-запись. Это позволяет контролировать, какие источники он анализирует и где имеет право изменять данные. Когда же речь заходит о наиболее чувствительных действиях — отправке форм, переводе средств, изменении пользовательских настроек — агент обязан передать решение самому человеку. Лишь после явного подтверждения пользователь разрешает действие, а прозрачный журнал операций даёт возможность понять, как агент пришёл к тому или иному результату. Т.е. здесь предлагается Human-in-the-Loop с обоснованием. Ну и по-мелочи, вроде сканирования страниц на предмет признаков промпт-инъекций локальной моделью перед передачей их содержимого агенту, и создания в рамках процесса разработки браузера ИИ-низированной команды «красных», тычущей браузерным агентом в скрафченные вредоносные сайты. ⚠ TL;DR: Google думают, что создали защиту от косвенных промпт-инъекций в контексте agentic-бразуера. По сравнению с попытками предшественниковI, она хотя бы просто есть, так ещё и выглядит эстетично. Но запастись попкорном, на всякий случай — лишним не будет 🍿

601

Предыдущий пост. 💻 Ruby: • Аналогично JS и Python, опасен рекурсивный deep_merge или любое слияние, которое устанавливает инстанс- или класс-переменные на основе данных пользователя. • Не доверяйте deep_merge на объектах: стандартный Hash#deep_merge безопасен для чистых хешей, но при объединении атрибутов объекта он может добавить методы. Всегда контролируйте, какие атрибуты ставятся через attr_accessor или instance_variable_set. Если используется ActiveSupport или Hashie для слияния, проверяйте, закрыты ли методы (Hashie блокирует переопределение методов, но ключи вида _/! могут обойти защиту). • Не используйте eval/instance_eval или небезопасный to_proc на пользовательских данных. • Ограничивайте область действия включаемых модулей: при include/extend убеждайтесь, что приватность методов не «размывается» — по возможности убирайте ненужные методы через undef_method или делайте их private. Это не устранит атаку слияния, но уменьшит «плохой» код, который можно подменить. • Замораживайте, по мере возможности: Ruby позволяет вызывать freeze на объектах, исключая дальнейшее изменение их переменных. Подумайте о замораживании всех неизменяемых конфигурационных объектов, если это не сломает логику приложения. 🖥 PHP: • Прямого аналога прототипов тоже нет, но есть опасность перезаписи свойств: функции-слияния с объектов не имеют смысла (результат – stdClass), но стандартные foreach или (object)$array могут изменить экземпляр класса. Избегайте кода вида foreach($data as $k=>$v) { $obj->$k = $v; } без фильтрации ключей. • Используйте массивы вместо объектов: например, при json_decode($json) указывайте вторым параметром true, чтобы получить массив, а не объект. Тогда не получится неявно «пролить» данные в объект. • Проверяйте ключи и поля: если какие-то поля приходят из запроса и затем ставятся в атрибуты объектов — убедитесь, что это ожидаемые поля. Незнакомые ключи — игнорируйте или блокируйте. • Не используйте unserialize() на пользовательских данных: это другая категория уязвимостей, но тоже позволяет менять внутренние данные объектов. Для передачи сложных структур лучше json_encode/decode с валидацией. Другие языки: • В💻 Java и 💻 необходимо следить за безопасностью десериализации и рефлексии. Например, не внедрять из JSON имена классов/методов напрямую (Class.forName и т.п.); в конфигурационных классах делать поля private final. Используйте sealed или final классы везде, где это возможно. В 👣 и 👣 Rust аналогичная история: в общем подходе по-прежнему нужно валидировать JSON по структуре (Go) и использовать serde/serde_json (Rust) без включения нестандартных поведений. Как-то так 🤓 ⚠ TL;DR: Лонгрид — не заслуживает внимания, оставайтесь c уязвимыми проектами)

601

Уже лишь только ленивый не написал про CVE-2025-55182 aka React2Shell, пересказывая своими словами райтапы, пересказанные ранее другими авторами с пересказанных ещё кем-то постов. Повторяться смысла нет, но вот ещё раз вспомнить, что делать разработчикам, чтобы не допустить подобную уязвимость у себя в проекте — лишним точно не будет. ✖️ Что НЕ сделали разработчики React'а? Команда React не предусмотрела надёжную проверку и фильтрацию данных при десериализации входных нагрузок RSC (React Server Components). В результате они могли расширять свойства объектов без достаточной валидации (например, путём инъекции proto), что позволяло загрязнять прототипы (prototype pollution) и выполнять произвольный код на сервере. ✅ Что делать разработчикам? Зависит от языка, поскольку на похожие грабли можно наступить и некоторых других языках. 💻💻: • Используйте структуры данных без прототипа: вместо пустых объектов {} применяйте Object.create(null) или литерал {__proto__: null}. Это предотвратит наследование опасных свойств от Object.prototype. • При необходимости используйте ассоциативные коллекции — применяйте new Map() и new Set() вместо обычных объектов. У них нет «прототипа» в классическом понимании, и методы вроде .get()/.has() возвращают только значения. • Замораживайте глобальные прототипы: например, вызов Object.freeze(Object.prototype) (и/или Object.seal) заблокирует добавление или изменение свойств базового прототипа. Это затруднит атаки, но нужно учитывать, что многие библиотеки рассчитывают на динамическое расширение объектов. • При запуске Node.js можете указать флаг --disable-proto=delete — он полностью удалит свойство __proto__ из стандартных объектов. • Санитизируйте имена полей при объединении/парсинге JSON: запрещайте или фильтруйте ключи вроде __proto__, prototype, constructor и подобных. Лучше всего – явно разрешать (whitelist) только ожидаемые имена полей и отбрасывать все остальное. • Избегайте небезопасных merge-функций (например, lodash.merge, рекурсивных функций объединения объектов) при работе с внешними данными. Если мёрдж неизбежен, тщательно проверяйте, как реализована функция: нет ли в ней присвоения прототипов или вызова setattr (в JS – методов вроде Object.assign/reduce). 💻 Python: • Не используйте pickle, или хотя бы не выполняйте pickle.loads на входных данных. Если нужна сериализация, используйте безопасный формат (JSON, json/yaml без пользовательских конструкторов). • Избегайте рекурсивного слияния атрибутов объектов из пользовательских словарей. Любая функция типа merge(src, dst) может при наличии поля __class__ или __globals__ обойти границы объекта и изменить класс или глобальные переменные. Проверяйте, что входные данные не содержат ключей, начинающихся с __ или равных именам методов объектов. • Ограничивайте динамическое добавление атрибутов. При необходимости используйте __slots__ в классах или явно задавайте список полей (например, через dataclasses), чтобы неизвестные атрибуты просто игнорировались. По возможности не добавляйте атрибуты в классы по именам из JSON. • Проверяйте использование setattr и init: ни в коем случае не допускайте передачи строкового кода или списка методов для выполнения через eval/instance_eval внутри __init__ или других «магических» методов. • Замораживайте и не раскрывайте конфиденциальные переменные: не давать внешнему коду доступ к глобальному состоянию приложения (модули, конфиг и т.д.), тем более через __globals__/__class__. Продолжение — в следующем посте.

601

Почему мы почти не фокусируемся на работе, и как с этим бороться Часто случается так, что в конце дня вы ощущаете себя рабом, отпахавшем на галере, с одной стороны, но и с ощущением бесцельно прожитого дня, с другой? Особенно в дни, когда пришлось сорваться в офис с привычной удаленки на несколько встреч? 🤗 Вышедшая на днях статья «The Math of Why You Can’t Focus at Work» утверждает, что большинство проблем с концентрацией легко объясняются не силой воли или дисциплинированностью, а не зависящими от них тремя параметрами, которые можно формализовать в понятную и в чем-то даже изящную систему. Прелесть этой системы в том, что она напрямую не основана на каких-либо трудновоспроизводимых исследованиях, работе с фокус-группами и т.п. Автор рассматривает рабочий день, как процесс, в котором внешние события возникают случайно, примерно как в модели пуассоновского потока. Все переменные этого процесса любой желающий может подобрать под себя сам, а выводы, которые из этого последуют, опираются лишь на конечность продолжительности рабочего времени в сутках. Ключевые параметры 1. Частота прерываний (λ) Любой внешний стимул — сообщение, пуш-уведомление, созвон, «разговор на пару минут» — дробит рабочий день на мелкие фрагменты. Рост λ — гарантированная потеря структуры дня, независимо от навыков, настроения собранности. 2. Стоимость возврата в контекст (Δ) После прерывания нужно время на реконструкцию модели задачи. Среднее Δ выглядит маленьким (5–15 минут), но на масштабе дня превращается в часы «скрытых» потерь. 3. Порог глубокого фокуса (θ) Для нетривиальных задач нужен минимальный непрерывный интервал. Если временной слот < θ, работа идёт, но ценность почти не растёт — ничем, кроме рутины, заняться не удаётся. Возможные сценарии Шумный день • Около двух десятков прерываний. • Большинство доступных интервалов не пересекает θ. • Около 4 часов полезной работы и всего один нормальный блок фокуса. Формально «работали весь день», фактически — мало в чём продвинулись. День с контролем среды • Меньше внешних событий + быстрый возврат в задачу. • 6+ часов продуктивного внимания. • Несколько последовательных глубоких интервалов. Здесь эффект нелинейный: снизили λ на 20–30%, а качество дня выросло кратно. Что важно • Вред приносит не количество задач, а фрагментация внимания. • Одно «вставленное» совещание портит весь рабочий график, разрушая потенциальные интервалы ≥ θ. • Пинг-культура в чатах увеличивает λ до уровня, где глубокая работа становится статистически маловероятной. • Без управления этими параметрами невозможно стабильно планировать сроки, качество работы и комплексные задачи. Автор также собрал симулятор карты рабочих дней, моделирующий предложенную им систему по заданным параметрам (залипнув в котором, можно запросто прощелкать слот-другой глубокого фокуса, btw). ⚠ TL;DR: Продуктивность — это не дисциплина, а параметры среды. Управляете прерываниями (λ), сокращаете количество возвратов в контект (Δ), защищаете фокусные слоты (θ) — получаете системный кратный прирост качества и скорости. Игнорируете — получаете «рабочие будни», в которых почти ничего не достигнуто, кроме ощущения лютой вымотанности к концу дня.

601

Как разработчику быстро углубиться в тему LLM? Часть 1 В жизни каждого разработчика наступает момент, когда поверхностного знания технологии становится недостаточно, и возникает необходимость углубиться в детали, чтобы использовать её более эффективно и осознанно. В случае LLM это означает, что рано или поздно, вкатившийся в эти темы разработчик захочет побольше узнать о таких вещах, как: 1. Токенизация и эмбеддинги 2. Механизмы внимания 3. Архитектуры трансформеров 4. Популярные архитектуры LLM 5. Проблемы и решения при работе с LLM 6. Обучение моделей 7. Эффективный инференс и деплой Звучит, как план, правда? ☺️ 1. Токенизация и эмбеддинги Современные большие языковые модели работают на основе векторных представлений и механизма внимания, заложенного в архитектуру трансформеров. Первым шагом в обработке текста является токенизация — разбиение входной строки на токены, которые могут представлять собой слова, части слов или отдельные символы. Компиляторщиков и разработчиков средств анализа кода этот термин может слегка смутить, т.к. в NLP токенами не всегда принято считать то, что является ими в формальных языках. На практике широко используется subword-токенизация, например Byte-Pair Encoding: так, слово unhappiness может быть преобразовано в последовательность «un», «happi» и «ness». Такой подход уменьшает размер словаря и позволяет эффективно работать с редкими или ранее невстречавшимися словами. Каждый токен получает уникальный идентификатор, по которому модель извлекает его вектор из матрицы эмбеддингов. Эмбеддинг — это высокоразмерный числовой вектор, отображающий семантику токена. После токенизации каждый элемент текста фактически превращается в набор чисел, отражающих его смысловые связи. Чем ближе по смыслу токену друг к другу, тем меньшее расстояние между ними в векторном пространстве. Например, вектор для слова apple окажется ближе к fruit, чем к car. Матрица эмбеддингов может быть очень крупной: при словаре около 50 000 токенов и размерности эмбеддинга 12 288, как у GPT-3, она содержит порядка 614 миллионов параметров. Поскольку трансформер не имеет встроенного понимания порядка токенов, к смысловому вектору добавляется позиционное кодирование. Итоговый вектор для каждого токена является суммой эмбеддинга и позиционного вектора, что позволяет модели учитывать как семантическое значение, так и положение токена в последовательности. Такая комбинация служит входом для дальнейшей обработки слоями внимания. Познакомиться с этой темой ближе позволит статья «Глубокое погружение в токенизацию», для более глубокого погружения можно упороться в видеолекции (первая, вторая) от ФКН ВШЭ, или от Стэндфорда (выборочно, из первых 6 лекций), если «глубинное обучение» режет слух, и хочется привычного «deep learning». Для специализированных задач типа анализа исходного кода, существуют отдельные модели эмбеддингов. Так, jina-embeddings-v2-base-code поддерживает английский язык и около 30 языков программирования, способна обрабатывать последовательности до 8192 токенов и оптимизирована для семантического поиска по коду. В таких моделях принципы токенизации и построения эмбеддингов остаются теми же, но словарь и обучающие данные адаптированы к структурам и паттернам программного кода. Говоря о структурах, отдельно стоит отметить модели, опирающиеся на различные графовые представления кода, и позволяющие за счет этого намного точнее учитывать семантику кодовых баз: • code2vec / code2seq: Path-Attention поверх AST • GraphCodeBERT: Transformer поверх DFG + элементы GNN • CuBERT: Transformer поверх фич CFG • Devign: GNN поверх AST+CFG+DFG • Code T5 / Code T5+: Transformer поверх AST-токенов Ну и куда же без изучения тематической awesome-подборки, на правах домашнего задания 🤓

601

Поэзия как джейлбрейк: стихи ломают защиту LLM Авторы исследования «Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models» протестировали 25 моделей (OpenAI, Anthropic, Google, DeepSeek, Mistral, Meta, Qwen и др.), подавая им опасные запросы… в рифму. Два эксперимента: 1. 20 вручную написанных стихов о кибератаках, CBRN (химическое, биологическое, радиологическое и ядерное оружие), манипуляциях и потере контроля. 2. 1200 «вредных» промптов из открытого бенчмарка MLCommons AILuminate, автоматически превращённых в стихи. Результаты оценивали LLM-судьи и люди. Метрика — ASR (Attack Success Rate), доля небезопасных ответов. Результаты Ручные стихи: 62% средний успех атаки • gemini-2.5-pro: 100% • DeepSeek / Mistral / Qwen: 80–95% • Лишь Claude и GPT-5-nano удержали 0–10%. Автогенерированные стихи: • Проза: 8% ASR • Стихи: 43% ASR → рост в 5 раз По темам: • Приватность: +45 п.п. • Ненасильственные преступления: +39 п.п. • CBRN: +38 п.п. Обсуждение кибератак в стихах дало 84% успеха 🤩 Почему поэзия работает 1. Фильтры обучены на прозе, а метафоры и ритм «смещают» текст от ожидаемого распределения. 2. Модели воспринимают стихи как безопасный жанр и снижают строгость отказов. 3. Большие модели уязвимее — лучше понимают переносный смысл, но не успевают применить защитные эвристики. 4. Эффект универсален: наблюдается у всех провайдеров и почти во всех категориях вреда. Что это значит • Текущие бенчмарки и сертификация (в духе EU AI Act) переоценивают безопасность — они не проверяют стилистические обходы. • Нужны новые тесты, где намерение пользователя выражено не только прямым текстом, но и через поэзию, нарратив, юмор и бюрократический стиль. • Без этого защиты условны: LLM остаются уязвимыми к самым простым «поэтическим» джейлбрейкам. ⚠ TL;DR: Исследование показало: достаточно переписать вредный запрос в стихах — и защита крупных языковых моделей рушится. Поэтическая форма становится универсальным одностадийным джейлбрейком: для некоторых моделей доля небезопасных ответов превышает 90%, в среднем рост атак-успеха — в 4–5 раз по сравнению с прозой.