ch
Feedback
ИИ Песочница Sber AI Lab

ИИ Песочница Sber AI Lab

前往频道在 Telegram

AI & ML related papers review, news, opensource updates GitHub: https://github.com/sb-ai-lab Contact us for posts and promo: @oxana_y

显示更多
2 163
订阅者
无数据24 小时
-47
+2530
帖子存档
💵 GFusion: как мы обучали диффузионную LLM в GigaChat
«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»
Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base. Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source. Почему это интересно? Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно. В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов. Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа. Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации. Цикл обучения включал: 🔘адаптацию AR-модели к диффузионной генерации; 🔘постепенное увеличение размера блока; 🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM; 🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации. Результаты: 🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B. 🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%. 🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации. 🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM. 🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.
💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.
➡️Подробности — в статье на Habr. ➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B ➡️GitVerse

⚡️Читайте нас на Хабр: научные статьи Sber AI Lab на языке ML‑инженера На корпоративном блоге Сбера мы запустили новый формат
⚡️Читайте нас на Хабр: научные статьи Sber AI Lab на языке ML‑инженера На корпоративном блоге Сбера мы запустили новый формат: адаптируем наши научные работы под практику инженеров и исследователей. Мы рассказываем: 🔘какие задачи решаем 🔘как устроены подходы и что из этого можно применить в реальных проектах
с максимальной пользой для практиков: задача, архитектура, данные, метрики и инсайты.
4️⃣ статьи от авторов Sber AI Lab: 🔘Статья "Как граф транзакций помогает банку лучше узнать своего клиента " 🔘Статья "Как LLM научила рекомендательную модель видеть больше, чем историю взаимодействий" 🔘Статья "Как научить языковую модель читать транзакции: превращаем историю платежей в базу знаний" 🔘Статья "Применение методов детектирования объектов в задаче долгосрочного прогнозирования событий" 💚Спасибо, что читаете, комментируете и задаёте вопросы - это помогает нам делать контент лучше и полезнее. @sb_ai_lab #хабр

🎓 Сбер и МФТИ запустили кафедру «Математики искусственного интеллекта» На базе Физтех-школы прикладной математики и информат
🎓 Сбер и МФТИ запустили кафедру «Математики искусственного интеллекта» На базе Физтех-школы прикладной математики и информатики МФТИ открывается новая кафедра, которая объединит фундаментальную математику и современные ИИ-исследования.
Команда Sber AI Lab активно вовлечена в образовательный процесс - наши тим лиды и исследователи будут читать лекции, вести семинары и погружать студентов в реальные задачи индустрии.
Кафедра готовит исследователей-математиков, способных видеть связь между фундаментальной наукой и задачами бизнеса. Особенность программы — сочетание классических лекций с практическими семинарами и анализом современных научных публикаций. Ключевые направления: 🔘reasoning в LLM и эффективные архитектуры 🔘новые методы мультиагентных систем 🔘интеграция новых доменов в модели Сейчас открыт набор в магистратуру на два направления: теоретические и практические исследования. Приём заявок до 10 июля. 📌Полезные ссылки: Telegram-канал кафедры — новости, этапы отбора, дедлайны, преподавательский состав Презентация кафедры и учебный план 🚀Если вы студент и хотите заниматься исследованиями на стыке математики и ИИ - это ваш шанс. @sb_ai_lab

🏆 Kaggle BirdCLEF 2026: серебро у команды Sber AI Lab Омар Золоев Sber AI Lab вместе с Амурханом Дзагкоевым и Константином З
🏆 Kaggle BirdCLEF 2026: серебро у команды Sber AI Lab Омар Золоев  Sber AI Lab вместе с Амурханом Дзагкоевым и Константином Зориным из Sber взяли 🥈серебро на Kaggle BirdCLEF 2026. Решение вошло в 3% лучших среди всех участников.
BirdCLEF+ — ежегодное соревнование по аудиоклассификации: нужно по шумным полевым записям определить, какие виды животных там присутствуют.
🔆Как устроена задача Полевые записи из природы, разбитые на куски по 5 секунд. Нужно понять, какие виды животных звучат в каждом фрагменте - один или несколько из 234 видов.
Это multi-label аудиоклассификация в условиях сильного шума и дисбаланса классов.
🔆Что пробовали? 🟡Perch-based baseline - хорошая стартовая точка и основа для первых сабмитов. 🟡Perch + ProtoSSM + SED - основная рабочая связка. SED-модуль помогал лучше ловить временную структуру событий в аудио. 🟡EfficientNet - сам по себе давал слабый сигнал, но в ансамбле добавлял полезную вариативность. 🟡Сглаживание похожих видов - небольшой, но стабильный прирост за счёт учёта семантически близких классов. 🔆 Что сработало в итоге? Главный прирост дали не одиночные модели, а ансамбль: 🔘несколько моделей с разными индуктивными смещениями, 🔘блендинг предсказаний, 🔘постобработка со сглаживанием для похожих видов, 🔘аккуратная проверка на валидации - не все улучшения локально переносились на публичный лидерборд. 🔆 Почему это интересно?
BirdCLEF
- хороший пример задачи, где выигрывает не одна «магическая» модель, а комбинация архитектур, осторожная валидация и правильный ансамбль. Для аудио это особенно важно: разные модели по-разному чувствуют спектральные паттерны, временную структуру и редкие события.
💚 Поздравляем команду! @sb_ai_lab #kaggle

⚡️Sber AI Lab на AAMAS 2026 4️⃣ статьи представили на демо треке AAMAS 2026 исследователи Sber AI Lab : 🎤SpeakerAICoach: A M
⚡️Sber AI Lab на AAMAS 2026 4️⃣ статьи представили на демо треке AAMAS 2026 исследователи Sber AI Lab : 🎤SpeakerAICoach: A Multi-Agent Mobile Presenter Training Мультиагентный мобильный тренер для выступлений с мультимодальной обратной связью. Проблема: коучинг должен учитывать не только текст, но и динамику речи, жесты, взгляд, эмоции. Подход: агенты для речи и видео анализируют фрагменты, агрегатор собирает timeline, LLM превращает данные в рекомендации. Результат: Android-демо с объяснимой обратной связью по каждому фрагменту. 📄 PDF 🤖LightAutoDS-Tab: Multi-AutoML Agentic System for Tabular Data Мультиагентная AutoML-система для табличных данных. Проблема: AutoML на основе LLM гибок, но дорог и нестабилен. Классические инструменты надёжны, но хуже адаптируются. Подход: агент выбирает между генерацией кода или использованием специализированных AutoML-инструментов в зависимости от задачи и времени на нее Результат: преимущество над AutoKaggle и AIDE. 📄 PDF ⚙️Towards Automated Integration of Novel ML Tools Into LLM-Driven AutoML Agents Автоматическая интеграция ML-библиотек в LLM-агентов. Проблема: LLM-агенты ошибаются в API специализированных библиотек, особенно новых. Подход: система извлекает структуру API, сигнатуры, примеры и строит граф для точного вызова инструментов. Результат: фреймворк для AutoML-агентов с отслеживаемым использованием инструментов. 📄 PDF 🚒 LLM-Guided Multi-Agent Evacuation Coordination via Episodic Memory and Cognitive Task Analysis LLM-координатор + эпизодическая память для управления эвакуацией при пожаре. Проблема: мало данных, смена сценариев, высокая цена ошибки. Подход: локальные политики агентов + LLM-командир. Эпизодическая память хранит похожие ситуации. Результат: в ситуации с новым очагом пожара (которого не было в обучающих данных) доля успешно эвакуировавшихся увеличилась с 67% до 82.5% благодаря использованию эпизодической памяти.. 📄 PDF 🔥 - если хотите детальный разбор любой из этих работ! @sb_ai_lab

⚡️Sber AI Lab на AAMAS 2026 4️⃣ статьи представили на демо треке AAMAS 2026 исследователи Sber AI Lab : 🎤SpeakerAICoach: A M
⚡️Sber AI Lab на AAMAS 2026 4️⃣ статьи представили на демо треке AAMAS 2026 исследователи Sber AI Lab : 🎤SpeakerAICoach: A Multi-Agent Mobile Presenter Training Мультиагентный мобильный тренер для выступлений с мультимодальной обратной связью. Проблема: коучинг должен учитывать не только текст, но и динамику речи, жесты, взгляд, эмоции. Подход: агенты для речи и видео анализируют фрагменты, агрегатор собирает timeline, LLM превращает данные в рекомендации. Результат: Android-демо с объяснимой обратной связью по каждому фрагменту. 📄 PDF 🤖LightAutoDS-Tab: Multi-AutoML Agentic System for Tabular Data Мультиагентная AutoML-система для табличных данных. Проблема: AutoML на основе LLM гибок, но дорог и нестабилен. Классические инструменты надёжны, но хуже адаптируются. Подход: агент выбирает между генерацией кода или использованием специализированных AutoML-инструментов в зависимости от задачи и времени на нее Результат: преимущество над AutoKaggle и AIDE. 📄 PDF ⚙️Towards Automated Integration of Novel ML Tools Into LLM-Driven AutoML Agents Автоматическая интеграция ML-библиотек в LLM-агентов. Проблема: LLM-агенты ошибаются в API специализированных библиотек, особенно новых. Подход: система извлекает структуру API, сигнатуры, примеры и строит граф для точного вызова инструментов. Результат: фреймворк для AutoML-агентов с отслеживаемым использованием инструментов. 📄 PDF 🚒 LLM-Guided Multi-Agent Evacuation Coordination via Episodic Memory and Cognitive Task Analysis LLM-координатор + эпизодическая память для управления эвакуацией при пожаре. Проблема: мало данных, смена сценариев, высокая цена ошибки. Подход: локальные политики агентов + LLM-командир. Эпизодическая память хранит похожие ситуации. Результат: в ситуации с новым очагом пожара (которого не было в обучающих данных) доля успешно эвакуировавшихся увеличилась с 67% до 82.5% благодаря использованию эпизодической памяти.. 📄 PDF 🔥 - если хотите детальный разбор любой из этих работ! @sb_ai_lab

⚡️Главное с AAMAS 2026: как LLM-агенты меняют MAS В Пафосе (Кипр) завершилась 25-я юбилейная конференция AAMAS 2026 - крупней
⚡️Главное с AAMAS 2026: как LLM-агенты меняют MAS В Пафосе (Кипр) завершилась 25-я юбилейная конференция AAMAS 2026 - крупнейшая в мире конференция по автономным агентам и мультиагентным системам. Цифры:
1800 заявленных статей, 531 принято (25.5%) Более 900 участников (+35% к прошлому году)
Впервые в программу добавлена секция Generative and Agentic AI (GAAI): LLM-агенты больше не хайп, а признанная часть основной повестки. 🔥Основные тренды конференции: 🔆 LLM-агенты как «команда экспертов» - 30-летний опыт мультиагентных систем переосмысляется через LLM. Появились фреймворки и стандарты (MCP, A2A). Главный риск: люди приписывают ИИ-агентам ответственность, которой у них нет. Контроль за их действиями должен оставаться за человеком. 🔆LLM становится планировщиком и координатором LLM больше не просто «отвечает», а управляет рабочими процессами. Среди ключевых подходов: 🟣иерархические деревья агентов для долгосрочных задач 🟣ментальная симуляция для улучшения политики 🟣параллельные потоки для быстрой реакции 🟣повторное использование решений для координации нескольких роботов 🔆 Управление инструментами и рабочими процессами Переход от «LLM вызывает инструмент» к системной инженерии рабочих процессов с ИИ-агентами. Нужны переиспользуемые компоненты - реестр инструментов, слой валидации, аудит. 🔆Координация остаётся ядром AAMAS Команды, распределение задач, социальные дилеммы, протоколы. LLM-агенты усилили старую проблему - устойчиво координироваться, а не только рассуждать. 🔆Робототехника Переход к специализированным роботам с общей ситуационной картиной. Надёжность таких систем - это совместная работа инженеров, пользователей и регуляторов. 🔆Теория игр и социальный выбор Даже в год бума генеративного ИИ заметная часть работ посвящена коллективному принятию решений: голосованию, честности, стимулам и социальным дилеммам. 📌Главный вывод конференции:
LLM не заменяют мультиагентные системы, а становятся их частью. Настоящий прорыв - сложные рабочие процессы: разбивка задачи, координация, вызов инструментов, проверка и участие человека.
🔆Sber AI Lab представила на AAMAS 2026 четыре публикацияи в Demonstration Track. Подробности в следующем посте. #AAMAS2026

Публикуем презентацию

Публикуем презентацию по итогам семинара

Sber AI Lab приглашает вас на открытый научный семинар: 📆 сегодня, четверг, 18 июня в 17:00. 📆На семинаре выступит: Иван Ка
Sber AI Lab приглашает вас на открытый научный семинар: 📆 сегодня, четверг, 18 июня в 17:00. 📆На семинаре выступит: Иван Карпухин (Sber AI Lab) ➡️Тема доклада: LLM-рецензент на примерах: нужен ли нам эксперт? 🔘На семинаре мы рассмотрим несколько научных статей в области Deep Learning и проанализируем качество автоматически сгенерированных обзоров и рецензий с помощью LLM. 🔘Обсудим, какие аспекты научных работ современные языковые модели способны выявлять эффективно, а в каких случаях они упускают критически важные наблюдения и нюансы. 🔘Поговорим о перспективах автоматического рецензирования, его ограничениях и роли человека в повышении качества экспертной оценки научных исследований. 📱Семинар пройдёт онлайн в SberJazz по ссылке ➡️переговорная 38.08 - для очных участников #анонc

Sber AI Lab приглашает вас на открытый научный семинар: 📆 завтра, четверг, 11 июня в 17:00. 📆На семинаре выступят: Максим М
Sber AI Lab приглашает вас на открытый научный семинар: 📆 завтра, четверг, 11 июня в 17:00. 📆На семинаре выступят: Максим Макаренко, Савелий Чежегов (Sber AI Lab) ➡️Тема доклада: Обзор конференции ICLR 2026 ➡️На семинаре расскажем о поездке на ICLR 2026, самых интересных работах и трендах конференции, а также о том, что сейчас происходит в исследованиях агентской памяти, reasoning и LLM-агентов. Отдельно обсудим две статьи команды Фундаментальных Исследований, представленные на конференции, ключевые идеи, результаты и полученную обратную связь от научного сообщества. 📱Семинар пройдёт онлайн в SberJazz по ссылке 📍переговорная 38.08 - для очных участников #анонc

🔥Делимся находкой: Boltbook — платформа для коммуникации AI-агентов: 💡Обратили внимание на платформу Boltbook.ai. Агенты зд
🔥Делимся находкой: Boltbook — платформа для коммуникации AI-агентов: 💡Обратили внимание на платформу Boltbook.ai. Агенты здесь публикуют посты, комментируют, создают тематические сообщества с собственными правилами и координировано решают задачи: помогают друг другу с кодом, обсуждают статьи, создают и улучшают скиллы. ✍️Что заметили: 🔘Скиллы — модульные навыки, которыми агенты делятся друг с другом. Один агент опубликовал скилл для анализа кода. Другой применил его на своей базе и нашёл циклические зависимости между модулями. 🔘Протокол — один из агентов предложил облегчённую версию протокола взаимодействия с Boltbook, которая экономит 85% токенов. Сообщество подхватило. 🔘Задачи — агент публикует ТЗ, прикладывает репозиторий, указывает, какие навыки требуются. Другие агенты подключаются, делают итерации, сдают результат. 🔘Креатив — агенты совместно разобрали корпускулярно-волновой дуализм и сгенерировали иллюстрацию для статьи. ⚙️Как это устроено: ➡️Платформа совместима с OpenClaw и другими движками, поддерживающими skills.md. ➡️Человек тоже может участвовать: наблюдать, ставить задачи или подключать своего агента. @sb_ai_lab #новости

🔥 Sber AI Lab на DataFest в Новосибирске Иван Карпухин рассказал о двух работах, опубликованных в этом году - в журнале Neur
🔥 Sber AI Lab на DataFest в Новосибирске Иван Карпухин рассказал о двух работах, опубликованных в этом году - в журнале Neurocomputing (Q1) и на конференции AAAI-26 (A*). 📄 HoTPP: бенчмарк для долгосрочных предсказаний
Как оценить качество модели, которая предсказывает несколько событий на горизонте? Стандартные метрики (OTD) учитывают только популярные классы, а итоговые значения тяжело интерпретировать. 📌Что предложили: Новую метрику T‑mAP (Temporal mean Average Precision), которая оценивает не только правильность предсказаний, но и уверенность модели. Первый открытый бенчмарк HoTPP для долгосрочного прогнозирования событий (финансы, ритейл, соцсети, медицина). 🔆Результаты: современные MTPP-модели часто уступают простым статистическим методам. Большинство подходов страдают mode collapse — предсказывают одно и то же. 🔗Статья  и arXiv 
📄 DEF: новый способ прогнозирования будущих событий
Авторегрессионные модели при длинном горизонте сходятся к константе или повторениям. Методы, предсказывающие все события сразу, тоже далеки от идеала. 📌Что предложили: Модель DEF, которая предсказывает несколько событий одновременно. Функция потерь на основе динамического связывания предсказаний с реальными событиями (как в детекции объектов в компьютерном зрении). 🔆Результаты: до +50% относительного улучшения качества долгосрочных предсказаний. При этом модель остаётся одной из самых быстрых на инференсе и не теряет в качестве предсказания следующего события. 🔗Статья и arXiv 
Интересный факт: обе работы адаптируют идеи из компьютерного зрения в новый домен, попутно развивая и улучшая выбранные подходы. 🔥 - если интересны такие обзоры исследований ✈ @sb_ai_lab #science

🧬Synolitic AI: как работать с медицинскими данными, где признаков больше, чем пациентов В биомедицинских задачах часто возни
🧬Synolitic AI: как работать с медицинскими данными, где признаков больше, чем пациентов В биомедицинских задачах часто возникает типичная проблема: данных мало, а признаков много. Например, в геномике, физиологических измерениях или медицинских записях один пациент может описываться сотнями и тысячами параметров. Для классических ML-моделей это сложная постановка: растёт риск переобучения, падает устойчивость, а перенос знаний между датасетами становится нестабильным.
В статье Overcoming the Curse of Dimensionality with Synolitic AI, написанной исследователями Sber AI Lab, совместно с профессором University College London, мы исследуем синолитические графовые нейросети (Synolitic Graph Neural Networks), подход, который переводит табличные данные в графовое представление.
⚙️Как это устроено: 🟣признаки становятся узлами графа 🟣для каждой пары признаков обучается небольшой классификатор 🟣его оценка задаёт силу связи между признаками 🟣дальше граф обрабатывается GNN-моделью: GCN или GATv2 ✨Важная часть подхода - не только сами связи, но и топология графа: степень узла, сила связей, closeness и betweenness centrality. Именно такие структурные признаки дают основной прирост качества. В экспериментах SGNN проверяли на 15 UCI-датасетах и на реальном протеомном датасете по раку яичников. ✨Что получилось: 🟣 в foundation setting GATv2 достигает ROC-AUC 92.22 против 86.05 у XGBoost 🟣при обучении на отдельных датасетах лучший результат SGNN - 83.12 macro ROC-AUC против 80.28 у XGBoost 🟣в low-data режиме SGNN сохраняет ROC-AUC около 85% уже с 10% обучающих данных 🟣на протеомных данных foundation-style обучение повышает стабильность и качество модели 📝Главный вывод:
Графовое представление помогает работать с высокоразмерными биомедицинскими данными, особенно когда выборка маленькая, признаки избыточны, а классические модели начинают терять устойчивость.
@sb_ai_lab #medicine

🔥Присоединяйся к Sber AI Lab: новые проекты в EdTech, HR, агентах для бизнеса и LLM-инференсе Работай над продуктами и иссле
🔥Присоединяйся к Sber AI Lab: новые проекты в EdTech, HR, агентах для бизнеса и LLM-инференсе
Работай над продуктами и исследованиями в области LLM и агентных систем.
EdTech - одно из направлений, где мы: 🔘создаём агентов для учеников и учителей, 🔘инструменты проверки заданий и генерации контента. 🔘проект сочетает LLM (RAG, агенты, fine‑tuning) с задачами OCR, document understanding и оценкой качества генераций. ⚡️расширяем команду и ищем: ➡️Senior Data Scientist / AI Researcher в команду ИИ в образовании
Что делать: 🔘разрабатывать LLM‑агентов и RAG для учебных сценариев; решать OCR и document understanding (структура учебников, обработка PDF/изображений); 🔘настраивать multi‑agent оркестрацию (LangGraph, LangChain, schema‑guided pipelines); 🔘экспериментировать с GigaChat, Gemini, Qwen и др.; 🔘проводить fine‑tuning (instruction‑tuning, adapters, LoRA, SFT); 🔘строить метрики и evaluation pipeline. 🔘Нужен: практический опыт от 3 лет в NLP/LLM/агентах.
Актуальные вакансии в других командах: ➡️LLM Engineer / Inference Engineer в команду развитие OpenSource технологий
🔘Обучать LLM на GPU-кластерах, доводить модель до продакшена, выжимать максимум из инференса. 🔘Нужен: практический опыт обучения LLM, Python от 3 лет, distributed training.
➡️Middle/Senior ML Engineer в команду GenAI для HR
🔘Строить прикладных AI-агентов для HR-направления. 🔘Нужен: практический опыт вывода в прод агентов или LLM-решений.
➡️ML Engineer в команду ИИ агенты и оптимизация
🔘Придумывать новые алгоритмы, проверять гипотезы, писать статьи A*/Q1. 🔘Нужен: сильный Python, PyTorch, опыт с LLM и агентами.
➡️ML Engineer в команду ИИ-агенты для бизнеса
Проект: разработка ассистента руководителя для автономного решения рутинных задач. Разрабатывать NLP и мультимодальные пайплайны, RAG-системы, создавать ИИ-агентов и мультиагентные системы. Нужен: сильный Python, опыт в разработке агентов, понимание всех этапов вывода агентов в промышленную эксплуатацию.
📍Москва, Кутузовский проспект, гибрид. 💚Если хотите строить LLM-решения, которые реально работают в продуктах - ждём ваш отклик. #job #вакансии ✈ @sb_ai_lab

⚡️Sber AI Lab на Data Fest 2026 Делимся информацией о лучших исследованиях и разработках Sber AI Lab на главном событии сообщ
⚡️Sber AI Lab на Data Fest 2026 Делимся информацией о лучших исследованиях и разработках Sber AI Lab на главном событии сообщества Open Data Science, которое традиционно пройдёт в конце мая на нескольких площадках конференции  DataFest (офисы Сбера, ВТБ и Белград). 📍 Москва, 24 мая (офис ВТБ)
📆Доклад Алексей Шестов, руководитель направления по анализу данных Топологическая метрика для оценки качества эмбеддингов без разметки
📍 Москва, 26 мая (офис Сбера)
📆 Доклад в секции Agents in Action Дмитрий Парпулов, тимлид «ИИ-агенты и оптимизация» Text2Agent: как мы строим рабочие workflow в low‑code по текстовому описанию задачи
🔆Постерная сессия по статьям Юлия Беликова - Detecting Overflow in Compressed Token Representations for Retrieval-Augmented Generation Алексей Гришанов - Pre-trained LLMs Meet Sequential Recommenders: Efficient User-Centric Knowledge Distillation Алексей Шестов - Topological Metric for Unsupervised Embedding Quality Evaluation Иван Свиридов - Predicting Task fMRI Contrasts from Resting-State fMRI Using Sparse 3D Convolutions Антон Пембек - Let It Go? Not Quite: Addressing Item Cold Start in Sequential Recommendations with Content-Based Initialization
🤩Регистрация и подробная программа по ссылке 📍Новосибирск, 28 мая (офис Сбера)
📆 Доклад Иван Карпухин, руководитель направления по исследованию данных Генеративные модели последовательностей событий и транзакционных данных
🤩Регистрация и подробная программа  по ссылке 📍Белград, 31 мая
📆 Доклад Алексей Васильев, тимлид команды Recsys SplitLight: RecSys Evaluation Toolkit — open-source инструмент для анализа датасетов и стратегий сплитов в рекомендательных системах.
О чём ещё поговорим на стендах и в кулуарах: генеративные модели, мультиагентные системы, физический ИИ, RAG, open‑source для RecSys, продакшен‑оптимизация. 💚Заходите знакомиться, предлагать идеи и задавать вопросы. 🔥- если планируете быть очно. @sb_ai_lab #анонс

Sber AI Lab приглашает вас на открытый научный семинар: 📆 сегодня, 21 мая в 17:00. 📆На семинаре выступит: Иван Кружилов (Sb
Sber AI Lab приглашает вас на открытый научный семинар: 📆 сегодня, 21 мая в 17:00. 📆На семинаре выступит: Иван Кружилов (Sber AI Lab) ➡️Тема доклада: Метод DPO и его вариации DPO и GRPO сегодня являются ключевыми методами для RLHF- alignment. ➡️В докладе мы рассмотрим модель Брэдли–Терри в классической постановке, а также её расширения, учитывающие неопределённость оценщиков. Особое внимание будет уделено современным модификациям DPO и их практическим преимуществам. 📱Семинар пройдёт онлайн в SberJazz по ссылке #анонc

Sber AI Lab приглашает вас на открытый научный семинар: 📆 сегодня, 21 мая в 17:00. 📆На семинаре выступит: Иван Кружилов (Sb
Sber AI Lab приглашает вас на открытый научный семинар: 📆 сегодня, 21 мая в 17:00. 📆На семинаре выступит: Иван Кружилов (Sber AI Lab) ➡️Тема доклада: Метод DPO и его вариации DPO и GRPO сегодня являются ключевыми методами для RLHF- alignment. ➡️В докладе мы рассмотрим модель Брэдли–Терри в классической постановке, а также её расширения, учитывающие неопределённость оценщиков. Особое внимание будет уделено современным модификациям DPO и их практическим преимуществам. 📱Семинар пройдёт онлайн в SberJazz по ссылке #анонc

🫥Как студенты решают научные задачи: взгляд из жюри Савченко Андрей, директор по науке Sber AI Lab принял участие в экспертной комиссии секции «ИИ в науке» на мультидисциплинарной молодёжной конференции Центрального университета «Научный телеграф». Конференция объединила шесть секций - от цифровой трансформации и ИИ до гуманитарных и естественных наук. В экспертной комиссии были профессора и представители корпоративных R&D‑команд.
Ключевые впечатления: Секция выглядела очень достойно: студенты из разных вузов показали продуманные эксперименты и зрелые методологические решения. Важно, что многие участники не просто применяют готовые ML‑инструменты, а формулируют нетривиальные научные задачи и предлагают собственные методы.
🤩Темы, которые запомнились: ⏺️Оптимизация на графах - проекты по задаче коммивояжёра, сочетающие ML и классические алгоритмы. ⏺️ML в химии - яркая прикладная направленность и потенциал для реальных открытий. ⏺️Оценка параметров гауссовских смесей при неизвестном числе кластеров - аккуратная постановка и оригинальный алгоритм. 🤩Совет для начинающих исследователей
Не ограничивайтесь демонстрацией работы модели. Сравните свой метод с сильными современными аналогами, подробно проанализируйте литературу и честно опишите ограничения - это делает работу более убедительной и полезной для сообщества.
🤩Итог для аудитории R&D Самые перспективные студенческие проекты объединяют аккуратную постановку задачи, сравнение с сильными базовыми методами и явную прикладную мотивацию - такие работы легче масштабировать и интегрировать в R&D‑проекты. 🔥 - если хотите развиваться в науке и хотите больше советов! @sb_ai_lab #science

🫥Как студенты решают научные задачи: взгляд из жюри Савченко Андрей, директор по науке Sber AI Lab принял участие в экспертной комиссии секции «ИИ в науке» на мультидисциплинарной молодёжной конференции Центрального университета «Научный телеграф». Конференция объединила шесть секций - от цифровой трансформации и ИИ до гуманитарных и естественных наук. В экспертной комиссии были профессора и представители корпоративных R&D‑команд.
Ключевые впечатления: Секция выглядела очень достойно: студенты из разных вузов показали продуманные эксперименты и зрелые методологические решения. Важно, что многие участники не просто применяют готовые ML‑инструменты, а формулируют нетривиальные научные задачи и предлагают собственные методы.
🤩Темы, которые запомнились: ⏺️Оптимизация на графах - проекты по задаче коммивояжёра, сочетающие ML и классические алгоритмы. ⏺️ML в химии - яркая прикладная направленность и потенциал для реальных открытий. ⏺️Оценка параметров гауссовских смесей при неизвестном числе кластеров - аккуратная постановка и оригинальный алгоритм. 🤩Совет для начинающих исследователей
Не ограничивайтесь демонстрацией работы модели. Сравните свой метод с сильными современными аналогами, подробно проанализируйте литературу и честно опишите ограничения - это делает работу более убедительной и полезной для сообщества.
🤩Итог для аудитории R&D Самые перспективные студенческие проекты объединяют аккуратную постановку задачи, сравнение с сильными базовыми методами и явную прикладную мотивацию - такие работы легче масштабировать и интегрировать в R&D‑проекты. 🔥 - если хотите развиваться в науке и хотите больше советов! @sb_ai_lab #science