ИИ Песочница Sber AI Lab - Telegram 频道 @sb_ai

2 215

ICML 2026: главные тренды продолжаем делиться обзором и аналитикой с конференции

В Сеуле с 6 по 11 июля прошла 43-я ICML - одна из трёх самых престижных конференций по машинному обучению (A*, h5‑index 272). Цифры: 24 661 поданных работ - самая крупная конференция за всё время (2× по сравнению с ICML 2025) 6 552 приняты (26.6%) 168 устных докладов, 5 874 постера, 44 воркшопа

🔝Топ-5 тематик принятых работ: 🔘Large language models 🔘Applications: computer vision 🔘Deep learning: generative models and autoencoders 🔘Applications: chemistry, physics, earth sciences 🔘Applications: health, medicine 🎤Ключевые доклады

🔘Pascale Fung (HKUST) - агентам в реальном мире нужны модели мира: JEPA, VLWM, VL‑JEPA вместо пиксельных предсказаний. 🔘Verena Rieser (DeepMind) - сдвиг от запретов («не навреди») к позитивному выравниванию агентов. В реальных агентских сценариях, полных ценностно-нагруженных и неоднозначных решений, слепое следование правилам вредит. Предложена Habermas Machine - ИИ как нейтральный медиатор для группового консенсуса. В adversarial multi-turn framework перестановка фактов меняет решение модели в 13–22% случаев и сдвигает итоговую позицию к мнению пользователя на 6,5%. 🔘Arvind Narayanan (Princeton) -коллаборативные агенты успешнее автономных. RSI (Recursive Self-Improvement) не приведёт к AGI автоматически. Ключевой фокус: на создание бенчмарков и человеческую валидацию.

7️⃣главных трендов 1️⃣Генерация архитектур мультиагентных систем Вместо ручного дизайна - переиспользуемые блоки (review, voting, planning) и диффузионная генерация графа коммуникации агентов. 2️⃣ Память и контекст для долгосрочных агентов Context Folding -экономия контекста в 10×. BEACON — вехи для точной оценки в RL. MemoryArena - бенчмарк памяти в многосессионных задачах. 3️⃣ Эволюционный поиск вместо ручного дизайна Эволюционные стратегии впервые дообучают LLM целиком, превосходя RLHF. AutoNumerics-Zero (DeepMind) - эволюционный поиск математических функций. 4️⃣Стабильность агентского RL ARLArena - систематический разбор причин коллапса обучения. One Tool Is Enough - агент с одним инструментом обходит модели с 32B параметров. 5️⃣ Быстрый инференс LLM ThunderAgent- ускорение в 1.5–3.9×. Star Elastic (Nvidia) - одна модель с несколькими размерами. AgentOmit - пропуск лишних мыслей. 6️⃣Факты и безопасность Большинство фактологических ошибок - не отсутствие знаний, а неспособность их извлечь (DeepMind). Бинарная награда за факты снижает галлюцинации на 39%. Co-RedTeam - мультиагентный поиск уязвимостей кода. 7️⃣ Надёжность в продакшене Исследования реальных внедрений: надёжность агентов в ПРОМе обеспечивается ограничением автономности, короткими цепочками действий и ранним вмешательством человека. 💡Выводы ✔️Агенты становятся отдельным направлением, а не продолжением LLM-практики. На конференции заметен переход от «LLM + tools» к агентам с памятью, координацией, моделями мира и длинным горизонтом планирования. ✔️Надёжность и проверяемость выходят на первый план. Вопрос уже не в том, как поднять метрику, а в том, почему система ошибается: из-за знаний, извлечения, выравнивания, reward hacking или слабой постановки задачи. ✔️Эффективность снова стала центральной темой. Много сильных работ посвящено более дешёвому инференсу, семплированию, дообучению и разрежению. Для production это часто важнее, чем ещё один процент качества без понимания цены. ✔️Diffusion-модели закрепились как отдельный фронтир для языка и теории -это видно по награждённым работам и общему вниманию к diffusion language models и методам точного семплирования. ✔️Безопасность и выравнивание обсуждаются как прикладная инженерная задача. Вопрос уже не только в том, как ограничить модель, но и в том, какие инструменты для этого создаются и как они будут использоваться на практике. ❤ @sb_ai_lab #icml

2 215

Repost from Олимпиадные школы МФТИ

+5

Как попасть в Sber AI Lab и заниматься тем, что используют миллионы людей? Помните недавнюю лекцию Дарьи Денисовой, ведущего специалиста по исследованию данных Sber AI Lab — Центра практического Искусственного интеллекта Сбера? Она рассказала, как работают рекомендательные системы, почему алгоритмы так хорошо угадывают наши интересы и какую роль в этом играют математика, анализ данных и машинное обучение. После лекции многие ещё долго обсуждали услышанное, а мы решили пойти дальше и поговорили с Дарьей лично. Как олимпиады помогли ей попасть в Big Tech? Чем на самом деле занимается исследователь данных? И какой совет она дала бы тем, кто уже сейчас мечтает строить технологии будущего? Ответы — в карточках #мнениеэксперта

2 215

💚 Sber AI Lab активно работает с молодыми талантами: 🟢лекции в вузах 🟢темы для курсовых и дипломных работ 🟢летние школы со студентами 🟢поддержка школьников. На олимпиадной школе МФТИ Дарья Денисова рассказала про рекомендательные системы и как олимпиады помогают попасть в Big Tech. Интервью со спикером, подготовленное организаторами школы ниже ⬇️

2 215

Repost from Олимпиадные школы МФТИ

+5

Как попасть в Sber AI Lab и заниматься тем, что используют миллионы людей? Помните недавнюю лекцию Дарьи Денисовой, ведущего специалиста по исследованию данных Sber AI Lab — Центра практического Искусственного интеллекта Сбера? Она рассказала, как работают рекомендательные системы, почему алгоритмы так хорошо угадывают наши интересы и какую роль в этом играют математика, анализ данных и машинное обучение. После лекции многие ещё долго обсуждали услышанное, а мы решили пойти дальше и поговорили с Дарьей лично. Как олимпиады помогли ей попасть в Big Tech? Чем на самом деле занимается исследователь данных? И какой совет она дала бы тем, кто уже сейчас мечтает строить технологии будущего? Ответы — в карточках #мнениеэксперта

2 215

Repost from Олимпиадные школы МФТИ

2 215

💚Sber AI Lab активно работает с молодыми талантами: 🟢лекции в вузах 🟢темы для курсовых и дипломных работ 🟢летние школы со студентами 🟢поддержка школьников. На олимпиадной школе МФТИ Дарья Денисова из команды Recsys рассказала про рекомендательные системы и как олимпиады помогают попасть в Big Tech. Интервью со спикером, подготовленное организаторами школы ниже ⬇️

2 215

Repost from Sber AI

🚫 СТОЙТЕ, ГИГАЧАТ ХОЧЕТ ОТВЕТИТЬ Мы выложили в Open Source сразу две модели для работы со звуком: audio-native LLM GigaChat Audio и мультиязычное SOTA-распознавание речи GigaAM Multilingual. Обе работы приняты на Interspeech 2026 — главную мировую конференцию по речевым технологиям 🔥 Чем силён GigaChat Audio?

🤩 Понимает длинные записи Держит контекст до 2 часов аудио и свободно ориентируется внутри: находит момент, где обсуждали нужную тему, пересказывает фрагмент, собирает саммари с таймкодами. На записях 20–60 минут точность локализации событий — 48.3 IoU против ~0 у Voxtral, Phi-4 и Qwen3-Omni

🤩 Считывает эмоции По интонации и манере речи распознаёт настроение говорящего — 90%+ на бенчмарке Dusha — и учитывает его в ответе

🤩 Распознаёт русский на слух лучше аналогов RuBQ-Audio: 60,0 против 43,7 у Qwen3-Omni. А ещё — multi-turn диалог, перевод, классификация аудио и распознавание речи в одной модели

GigaAM Multilingual — расширение нашей SOTA-модели распознавания речи на казахский, киргизский, узбекский и английский. Компактная версия на 240M параметров обгоняет Whisper Large v3 и Omnilingual 1B, а аудиоэнкодер, предобученный на 2 млн часов речи на 70+ языках, адаптируется к новым языкам с минимумом данных: на грузинском и башкирском хватило одного Common Voice, чтобы дойти до WER ~4% против 11%+ у Whisper Ценность обеих моделей и предложенных методов уже подтвердило научное сообщество — наши статьи приняли на главную мировую конференцию по речевым технологиям Interspeech 2026 Модели уже работают в ГигаЧате: общайтесь голосом, присылайте голосовые сообщения и аудиофайлы.

Разработчикам предлагаем забрать GigaChat Audio и GigaAM Multilingual в Open Source вместе с датасетом TimeGround-1M

А если интересна техническая часть, читайте пост команды ↖️ ✔️ Подписывайтесь на Sber AI в МАКС

2 215

Repost from Sber AI

СКОЛЬКО ЧЕЛОВЕК ГОВОРИТ? 🤩 ❤️ — слышу двоих 👍 — кажется, три 🔥 — точно больше четырёх

2 215

⚡️Sber AI Lab на ICML 2026 (A*) 📍Конференция прошла в Сеуле с 6 по 11 июля. 🔆На основном треке исследователи Sber AI Lab и Brainlab представили статью: Softsign: Smooth Sign in Your Optimizer For Better Parameter Heterogeneity Handling

Авторы предложили два новых оптимизатора - SoftSignum и SoftMuon, которые плавно заменяют жёсткий знак в Sign-оптимизации. Это позволяет адаптивно регулировать размер шага для разных частей модели: на ранних этапах - быстрые шаги, на финальных - точная настройка.

🔆На воркшопах Андрей Савченко, директор по науке, Sber AI Lab и Николай Никитин, ИТМО представили две статьи:

1️⃣ On-Demand Multi-Agent Workflow Synthesis for Multimodal Long-Horizon Reasoning (SCALE Workshop) - подход для синтеза мультиагентных workflow под запрос, адаптирующийся к сложным мультимодальным задачам. 2️⃣ AutoJudge: Automatic Generation of LLM-Based Judges from Execution Traces (FAGEN Workshop) — метод автоматической генерации LLM-судей на основе трейсов выполнения для ускорения инференса и оценки качества.

🔥- если считаете, что три работы на главной конференции по ML это крутой результат. ❤ @sb_ai_lab

2 215

⚡️Sber AI Lab на ICML 2026 (A*) 📍Конференция прошла в Сеуле с 6 по 11 июля. 🔆На основном треке исследователи Sber AI Lab и Brainlab представили статью: Softsign: Smooth Sign in Your Optimizer For Better Parameter Heterogeneity Handling

Авторы предложили два новых оптимизатора - SoftSignum и SoftMuon, которые плавно заменяют жёсткий знак в Sign-оптимизации. Это позволяет адаптивно регулировать размер шага для разных частей модели: на ранних этапах - быстрые шаги, на финальных - точная настройка.

🔆На воркшопах Андрей Савченко, директор по науке, Sber AI Lab и Николай Никитин, ИТМО представили две статьи:

1️⃣ On-Demand Multi-Agent Workflow Synthesis for Multimodal Long-Horizon Reasoning (SCALE Workshop) - подход для синтеза мультиагентных workflow под запрос, адаптирующийся к сложным мультимодальным задачам. 2️⃣ AutoJudge: Automatic Generation of LLM-Based Judges from Execution Traces (FAGEN Workshop) — метод автоматической генерации LLM-судей на основе трейсов выполнения для ускорения инференса и оценки качества.

🔥- если считаете, что три работы на главной конференции по ML это крутой результат. ❤ @sb_ai_lab

2 215

+1

💵 GigaChat 3.5 Ultra: меньше, быстрее, сильнее

Сегодня мы выкладываем в open source GigaChat 3.5 Ultra — новую 432B-модель под MIT-лицензией. Это первый в open source гибрид GatedDeltaNet и MLA, доведённый до сотен миллиардов параметров, — с собственным рецептом обучения, который мы собирали больше чем в 1500 экспериментах. Модель выросла в коде, математике, агентных сценариях и на аренах — и при этом стала на 40% меньше, чем GigaChat 3.1 Ultra.

Что внутри: 🔘Собственная гибридная архитектура MLA + GatedDeltaNet с придуманной нами уникальной стабилизирующей обвязкой, без которой такой гибрид на этом масштабе просто не обучается; 🔘Gated Attention — модель может локально приглушать слишком сильный сигнал из attention-слоя; 🔘GatedNorm — нормализация с явным гейтом для управления масштабом сигнала между признаками. Модернизация этого слоя позволила нам стабильно обучать модели с большим количеством параметров. 🔘Линейный слой требует в 4 раза меньше KV-кеша на токен, в ту же память позволяет поместить в 2,14 раза больше контекста, throughput под нагрузкой растет на +20%; 🔘Две MTP-головы и ускорение генерации до 2,2 раза; 🔘FP8 на всех этапах обучения без потери качества относительно bf16 — свои Triton- и CUDA-ядра; 🔘Новый этап online RL после SFT и DPO. Результаты: 🔘GigaChat-3.5-Ultra-Base обходит DeepSeek V3.2 Exp Base и DeepSeek V4 Flash Base в среднем по нашему набору general-, math- и code-бенчмарков (полные таблицы — в статье); 🔘GigaChat-3.5-Ultra-Instant сравним с DeepSeek V3.2 по среднему скору, будучи в полтора раза меньше; 🔘По LLM-судье MiniMax-M2.7 средний win-rate против GigaChat 3.1 Ultra — 75,9%, а против GPT-5 — 68.7%.

Весь стек — данные (своя LLM-фильтрация Common Crawl, 600+ языков программирования в коде), архитектура, рецепт обучения, инфраструктура — сделан нами end-to-end.

🤖 Подробности, включая детали реализации гейтов и рецепт стабилизации, — в статье на Habr. ➡️HuggingFace | GitVerse

2 215

Repost from GigaDev — разработка GigaChat

💵 GFusion: как мы обучали диффузионную LLM в GigaChat

«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»

Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base. Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source. Почему это интересно? Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно. В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов. Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа. Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации. Цикл обучения включал: 🔘адаптацию AR-модели к диффузионной генерации; 🔘постепенное увеличение размера блока; 🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM; 🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации. Результаты: 🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B. 🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%. 🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации. 🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM. 🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.

💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.

➡️Подробности — в статье на Habr. ➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B ➡️GitVerse

2 215

⚡️Читайте нас на Хабр: научные статьи Sber AI Lab на языке ML‑инженера На корпоративном блоге Сбера мы запустили новый формат: адаптируем наши научные работы под практику инженеров и исследователей. Мы рассказываем: 🔘какие задачи решаем 🔘как устроены подходы и что из этого можно применить в реальных проектах

с максимальной пользой для практиков: задача, архитектура, данные, метрики и инсайты.

4️⃣ статьи от авторов Sber AI Lab: 🔘Статья "Как граф транзакций помогает банку лучше узнать своего клиента " 🔘Статья "Как LLM научила рекомендательную модель видеть больше, чем историю взаимодействий" 🔘Статья "Как научить языковую модель читать транзакции: превращаем историю платежей в базу знаний" 🔘Статья "Применение методов детектирования объектов в задаче долгосрочного прогнозирования событий" 💚Спасибо, что читаете, комментируете и задаёте вопросы - это помогает нам делать контент лучше и полезнее. ❤ @sb_ai_lab #хабр

2 215

🎓 Сбер и МФТИ запустили кафедру «Математики искусственного интеллекта» На базе Физтех-школы прикладной математики и информатики МФТИ открывается новая кафедра, которая объединит фундаментальную математику и современные ИИ-исследования.

Команда Sber AI Lab активно вовлечена в образовательный процесс - наши тим лиды и исследователи будут читать лекции, вести семинары и погружать студентов в реальные задачи индустрии.

Кафедра готовит исследователей-математиков, способных видеть связь между фундаментальной наукой и задачами бизнеса. Особенность программы — сочетание классических лекций с практическими семинарами и анализом современных научных публикаций. Ключевые направления: 🔘reasoning в LLM и эффективные архитектуры 🔘новые методы мультиагентных систем 🔘интеграция новых доменов в модели Сейчас открыт набор в магистратуру на два направления: теоретические и практические исследования. Приём заявок до 10 июля. 📌Полезные ссылки: Telegram-канал кафедры — новости, этапы отбора, дедлайны, преподавательский состав Презентация кафедры и учебный план 🚀Если вы студент и хотите заниматься исследованиями на стыке математики и ИИ - это ваш шанс. ❤ @sb_ai_lab

2 215

🏆 Kaggle BirdCLEF 2026: серебро у команды Sber AI Lab Омар Золоев Sber AI Lab вместе с Амурханом Дзагкоевым и Константином Зориным из Sber взяли 🥈серебро на Kaggle BirdCLEF 2026. Решение вошло в 3% лучших среди всех участников.

BirdCLEF+ — ежегодное соревнование по аудиоклассификации: нужно по шумным полевым записям определить, какие виды животных там присутствуют.

🔆Как устроена задача Полевые записи из природы, разбитые на куски по 5 секунд. Нужно понять, какие виды животных звучат в каждом фрагменте - один или несколько из 234 видов.

Это multi-label аудиоклассификация в условиях сильного шума и дисбаланса классов.

🔆Что пробовали? 🟡Perch-based baseline - хорошая стартовая точка и основа для первых сабмитов. 🟡Perch + ProtoSSM + SED - основная рабочая связка. SED-модуль помогал лучше ловить временную структуру событий в аудио. 🟡EfficientNet - сам по себе давал слабый сигнал, но в ансамбле добавлял полезную вариативность. 🟡Сглаживание похожих видов - небольшой, но стабильный прирост за счёт учёта семантически близких классов. 🔆 Что сработало в итоге? Главный прирост дали не одиночные модели, а ансамбль: 🔘несколько моделей с разными индуктивными смещениями, 🔘блендинг предсказаний, 🔘постобработка со сглаживанием для похожих видов, 🔘аккуратная проверка на валидации - не все улучшения локально переносились на публичный лидерборд. 🔆 Почему это интересно?

BirdCLEF

- хороший пример задачи, где выигрывает не одна «магическая» модель, а комбинация архитектур, осторожная валидация и правильный ансамбль. Для аудио это особенно важно: разные модели по-разному чувствуют спектральные паттерны, временную структуру и редкие события.

💚 Поздравляем команду! ❤ @sb_ai_lab #kaggle

2 215

⚡️Sber AI Lab на AAMAS 2026 4️⃣ статьи представили на демо треке AAMAS 2026 исследователи Sber AI Lab : 🎤SpeakerAICoach: A Multi-Agent Mobile Presenter Training Мультиагентный мобильный тренер для выступлений с мультимодальной обратной связью. Проблема: коучинг должен учитывать не только текст, но и динамику речи, жесты, взгляд, эмоции. Подход: агенты для речи и видео анализируют фрагменты, агрегатор собирает timeline, LLM превращает данные в рекомендации. Результат: Android-демо с объяснимой обратной связью по каждому фрагменту. 📄 PDF 🤖LightAutoDS-Tab: Multi-AutoML Agentic System for Tabular Data Мультиагентная AutoML-система для табличных данных. Проблема: AutoML на основе LLM гибок, но дорог и нестабилен. Классические инструменты надёжны, но хуже адаптируются. Подход: агент выбирает между генерацией кода или использованием специализированных AutoML-инструментов в зависимости от задачи и времени на нее Результат: преимущество над AutoKaggle и AIDE. 📄 PDF ⚙️Towards Automated Integration of Novel ML Tools Into LLM-Driven AutoML Agents Автоматическая интеграция ML-библиотек в LLM-агентов. Проблема: LLM-агенты ошибаются в API специализированных библиотек, особенно новых. Подход: система извлекает структуру API, сигнатуры, примеры и строит граф для точного вызова инструментов. Результат: фреймворк для AutoML-агентов с отслеживаемым использованием инструментов. 📄 PDF 🚒 LLM-Guided Multi-Agent Evacuation Coordination via Episodic Memory and Cognitive Task Analysis LLM-координатор + эпизодическая память для управления эвакуацией при пожаре. Проблема: мало данных, смена сценариев, высокая цена ошибки. Подход: локальные политики агентов + LLM-командир. Эпизодическая память хранит похожие ситуации. Результат: в ситуации с новым очагом пожара (которого не было в обучающих данных) доля успешно эвакуировавшихся увеличилась с 67% до 82.5% благодаря использованию эпизодической памяти.. 📄 PDF 🔥 - если хотите детальный разбор любой из этих работ! ❤ @sb_ai_lab

2 215

⚡️Sber AI Lab на AAMAS 2026 4️⃣ статьи представили на демо треке AAMAS 2026 исследователи Sber AI Lab : 🎤SpeakerAICoach: A Multi-Agent Mobile Presenter Training Мультиагентный мобильный тренер для выступлений с мультимодальной обратной связью. Проблема: коучинг должен учитывать не только текст, но и динамику речи, жесты, взгляд, эмоции. Подход: агенты для речи и видео анализируют фрагменты, агрегатор собирает timeline, LLM превращает данные в рекомендации. Результат: Android-демо с объяснимой обратной связью по каждому фрагменту. 📄 PDF 🤖LightAutoDS-Tab: Multi-AutoML Agentic System for Tabular Data Мультиагентная AutoML-система для табличных данных. Проблема: AutoML на основе LLM гибок, но дорог и нестабилен. Классические инструменты надёжны, но хуже адаптируются. Подход: агент выбирает между генерацией кода или использованием специализированных AutoML-инструментов в зависимости от задачи и времени на нее Результат: преимущество над AutoKaggle и AIDE. 📄 PDF ⚙️Towards Automated Integration of Novel ML Tools Into LLM-Driven AutoML Agents Автоматическая интеграция ML-библиотек в LLM-агентов. Проблема: LLM-агенты ошибаются в API специализированных библиотек, особенно новых. Подход: система извлекает структуру API, сигнатуры, примеры и строит граф для точного вызова инструментов. Результат: фреймворк для AutoML-агентов с отслеживаемым использованием инструментов. 📄 PDF 🚒 LLM-Guided Multi-Agent Evacuation Coordination via Episodic Memory and Cognitive Task Analysis LLM-координатор + эпизодическая память для управления эвакуацией при пожаре. Проблема: мало данных, смена сценариев, высокая цена ошибки. Подход: локальные политики агентов + LLM-командир. Эпизодическая память хранит похожие ситуации. Результат: в ситуации с новым очагом пожара (которого не было в обучающих данных) доля успешно эвакуировавшихся увеличилась с 67% до 82.5% благодаря использованию эпизодической памяти.. 📄 PDF 🔥 - если хотите детальный разбор любой из этих работ! ❤ @sb_ai_lab

2 215

⚡️Главное с AAMAS 2026: как LLM-агенты меняют MAS В Пафосе (Кипр) завершилась 25-я юбилейная конференция AAMAS 2026 - крупнейшая в мире конференция по автономным агентам и мультиагентным системам. Цифры:

1800 заявленных статей, 531 принято (25.5%) Более 900 участников (+35% к прошлому году)

Впервые в программу добавлена секция Generative and Agentic AI (GAAI): LLM-агенты больше не хайп, а признанная часть основной повестки. 🔥Основные тренды конференции: 🔆 LLM-агенты как «команда экспертов» - 30-летний опыт мультиагентных систем переосмысляется через LLM. Появились фреймворки и стандарты (MCP, A2A). Главный риск: люди приписывают ИИ-агентам ответственность, которой у них нет. Контроль за их действиями должен оставаться за человеком. 🔆LLM становится планировщиком и координатором LLM больше не просто «отвечает», а управляет рабочими процессами. Среди ключевых подходов: 🟣иерархические деревья агентов для долгосрочных задач 🟣ментальная симуляция для улучшения политики 🟣параллельные потоки для быстрой реакции 🟣повторное использование решений для координации нескольких роботов 🔆 Управление инструментами и рабочими процессами Переход от «LLM вызывает инструмент» к системной инженерии рабочих процессов с ИИ-агентами. Нужны переиспользуемые компоненты - реестр инструментов, слой валидации, аудит. 🔆Координация остаётся ядром AAMAS Команды, распределение задач, социальные дилеммы, протоколы. LLM-агенты усилили старую проблему - устойчиво координироваться, а не только рассуждать. 🔆Робототехника Переход к специализированным роботам с общей ситуационной картиной. Надёжность таких систем - это совместная работа инженеров, пользователей и регуляторов. 🔆Теория игр и социальный выбор Даже в год бума генеративного ИИ заметная часть работ посвящена коллективному принятию решений: голосованию, честности, стимулам и социальным дилеммам. 📌Главный вывод конференции:

LLM не заменяют мультиагентные системы, а становятся их частью. Настоящий прорыв - сложные рабочие процессы: разбивка задачи, координация, вызов инструментов, проверка и участие человека.

🔆Sber AI Lab представила на AAMAS 2026 четыре публикацияи в Demonstration Track. Подробности в следующем посте. #AAMAS2026