Complete AI
رفتن به کانال در Telegram
Меня зовут Андрей Кузнецов Директор FusionBrain Lab в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML
نمایش بیشتر7 787
مشترکین
-124 ساعت
-27 روز
+2430 روز
آرشیو پست ها
7 787
Всем привет!
Выложили нашу работу “Does VLA Even Know the Basics?” в Daily Papers на Hugging Face 🤗
В статье мы задаёмся простым, но пока почти не изученным вопросом: есть ли в VLA-моделях commonsense знания о мире? 📚
⚡️Мы предлагаем Act2Answer: бенчмарк, где VLA модель отвечает на вопросы не текстом, а действием - кладёт куб на правильный вариант. Проверили 7 VLA и 9 VLM моделей на 12 категориях.
💡Интересные инсайты из работы:
→ VLA хорошо понимают примитивные концепты по типу Цвета и Формы
→ На более сложных категориях (Эмоции, Животные, Симметрия, Время, Счет, История) у VLA сильный дроп в сравнении с VLM
→ Знания есть в весах VLA моделей, однако они не транслируются в действия
→ Котрейнинг на VL данных хорошо помогает сохранять знания
→ SFT/RL файтюнинг на downstream роботикс задачах дергадирует знания
Поддержите нас апвоутом пожалуйста ❤️
7 787
Repost from ИИ и роботы в стройке
Посмотрела выступление Анастасии Анциферовой, исполнительного директора по исследованию данных центра исследований генеративного ИИ Сбера, На митапе у VisionLabs она рассказала о последних разработках Сбера и AIRI для автоматизации проектирования зданий
🟣 Автоматизация генерации массингов
CoMa — метод генерация массингов по текстовым требованиям с описанием ограничений, координатам участка и изображению окружения. На выходе пользователь получает 3D-геометрию здания в формате JSON.
🟣 Генерация планировок
Для генерации планировок AIRI улучшила диффузионную модель HouseDiffusion (она по графу связности комнат генерирует координаты стен, но не учитывает фиксированные элементы, а еще иногда оставляет пустые пространства между комнатами).
AIRI представила HouseDiffusion++. Базовую модель дообучили на датасете из 62 тысяч планировок, добавили кросс-аттеншн-блоки, которые нужны, чтобы модель не двигала фиксированные элементы (вентиляционные шахты, окна или двери), а также возможность экспорта результата в Revit.
«Сейчас в основном в области планировок мы занимаемся генерацией жилых зданий, но на следующий год у нас запланировано расширение до создания планировок для общественных пространств, школ, больниц».
«По поводу удобства планировок у нас сейчас есть направление меблировки: мы учимся расставлять мебель так, чтобы агенты, которые ходят по квартире, эмулируя поведение людей, тратили минимальное количество шагов на типичные перемещения».🟣 Работа с BIM-моделями IFC-QA — бенчмарк для проверки языковых моделей на понимание BIM-файлов, В нем 99 вопросов пяти уровней сложности. Результаты показали: лучшая модель отвечает правильно только в 68% случаев. На простых вопросах точность достигает 90%, но на сложных, требующих многошаговых рассуждений, падает. Также у AIRI есть разработка Chat with IFC, где пользователь может получать ответы по IFC-файлу, просто в обычном чате с ИИ. Интересная штука — я узнаю, есть ли открытая работа. 🟣 Документация и чертежи
«Документация — сейчас самая горячая тема»Анастасия отметила, что больше всего внутренних и внешних запросов приходит на автоматизацию работы с документацией. Здесь основные направления: OCR (распознавание символов), RAG и работа с базами документов через ИИ-агентов. Основная сложность — учет нормативки: новые градостроительные нормы принимаются буквально каждый день. В следующих постах расскажу про метод CoMa.
7 787
ИИ уже меняет бизнес — вопрос только в том, кто им управляет?
Магистратура «Управление внедрением ИИ в бизнес» от МИФИ и «Школы 21» — для тех, кто хочет быть этим человеком.
Фокус обучения:
➡️ живые сценарии — куда встроить ИИ, чтобы было быстрее, дешевле, эффективнее
➡️ управление продуктами и понимание технологий, чтобы разговаривать с разработчиками на одном языке
➡️ реальные проекты от компаний прямо во время учёбы
А в конце — диплом МИФИ и портфолио, с которым можно идти на собеседование!
Все подробности и заявка — на сайте.
7 787
19 сентября состоится Practical ML Conf — хардовая конференция по практическому применению ML, где будем обсуждать технологии, которые уже работают!
Я состою в программном комитете уже не перый год, буду рад видеть вас лично и познакомиться с вашими проектами. Программный комитет отбирает доклады, опираясь на четыре основных критерия: пользу и новизну для сообщества, применимость на практике и хардовый уровень сложности.
Что планируем:
⚪ Эксперты программного комитета дадут советы по структуре и содержанию доклада
⚪ Прогоны материала вместе с тренером по публичным выступлениям
⚪ Нетворкинг с сильным ML-комьюнити
⚪ Промо спикеров и докладов до и после конференции
⚪ И самое главное — вы сможете стать частью главной конференции Яндекса по машинному обучению
Приём докладов заканчивается сегодня!
Подписывайтесь:
🔗 @Practical_ML_Conf
7 787
Стройте LLM-системы, а не просто вызывайте API
Записывайтесь на новый поток курса LLM-инженер от AI Talent Hub и GIGASCHOOL 🎓
Сейчас уже недостаточно просто знать RAG, рынок ищет тех, кто умеет собирать сложные AI-системы и доводить их до продакшена. Поэтому коллеги пересобрали программу, сохранили фундаментальную базу и усилили практическую часть.
Добавили сквозной проект с первого дня — вы собираете end-to-end LLM-систему под свой домен от адаптации модели до продакшена.
В программе production-инференс, управление нагрузкой и стоимостью, observability и LLMOps, system design, безопасность и AI Red Teaming.
Что окажется в вашем GitHub после курса:
➡️ Опыт дообучения LLM/энкодер под домен
➡️ RAG над корпоративной базой
➡️ Мультиагентная система
➡️ Production-сервис в Docker
➡️ Observability и отчет по безопасности
Лекции читают практики из крупных AI-команд: 👤 Роман Соломатин (NLP Researcher, Сбер) 👤 Александр Потехин (NLP Lead, X5 Tech) 👤 Кристина Желтова (Директор по разработке моделей, Газпромбанк) 👤 Евгений Кокуйкин (CEO HiveTrace)До четверга самая низкая стоимость, дальше будет расти. Изучайте программу и регистрируйтесь на курс!
7 787
Всем привет!
Мы с командой в рамках образовательного проекта решили провести исследование, как клиенты пользуются инструментами инвестирования для проработки идеи нового продукта автоматических инвестиций, использующего механику оплаты ЖКХ, налогов, кредитов и прочих платежей.
Для исследования сделали короткий анонимный опрос, который займёт не дольше одной минуты, но будет нам очень полезным.
Если вы поможете и внесёте свой вклад — вкупе это принесёт супер пользу, а итогами опроса поделюсь🙏
Ссылка на опрос
https://public.oprosso.sberbank.ru/p/jtmguucn
7 787
Repost from Ivan Oseledets’ Channel
+1
Второй раз получаю премию Билайна AI AWARDS — в этом году в номинации «Личный вклад в развитие ИИ».
Наверное, всё делаем правильно, раз наш вклад и сама нейросеть отмечает. Будем двигаться дальше.
7 787
Repost from N/a
А вы знали, что методы генерации видео можно использовать для прогноза погоды?
Наша команда разработала Marchuk — первую в России генеративную модель для прогнозирования климатических рисков.
Мы взяли диффузионные трансформеры (которые обычно генерируют изображения и видео) и научили их предсказывать погоду. И вот что получилось:
✔️Субсезонный диапазон: Marchuk позволяет строить прогнозы на 15-30 дней вперёд
✔️Компактная модель: имея всего 276M параметров, она показывает сопостовимое качество с 1,6B аналогом
✔️Доступность: Код и веса модели в открытом доступе, а запустить ее можно всего на одной видеокарте или в Colab
💡 Имя модели — дань уважения математику Гурию Ивановичу Марчуку, заложившему основы численного моделирования климатических процессов.
👇 Читайте подробности о разработке по ссылкам:
ArXiv | Project Page | GitHub | Colab | HF
7 787
В связи с расширением моей команды по разработке автономных универсальных ИИ-агентов в Сбере ищу сотрудников!
Чем мы занимаемся:
— Разрабатываем AI-агенты с адаптивным поведением и полной автономией — они самостоятельно решают задачи, учатся на данных и масштабируются в реальных сценариях (проектирование ядра агента, работа с «глубокими агентами», внедрение самообучающих петлей, построение мультиагентных систем)
— Создаем инструменты для развертывания и мониторинга моделей — от бесшовного деплоя в продакшен до автоматизированного отслеживания производительности, ошибок и оптимизации
Кого ждём:
🔘Middle/Senior AI Agent Engineer (Python)
Минимальный стек:
— Python 3.10+ (async, LangChain/LangGraph — StateGraph, чекпоинты, стриминг)
— LLM-провайдеры (OpenAI, Anthropic, OpenRouter), tool use, MCP для API/OAuth2
— Memory/RAG: векторные БД (Qdrant, Milvus, PGVector), гибридный поиск, факт-извлечение
— Мультиагенты: оркестрация (CrewAI-подобные), циклы восприятие→действие→рефлексия, самообучение
— Файловые системы как контекст-менеджеры, Docker, облака (AWS Bedrock, Azure)
— Безопасность: sandbox, safety-агенты, откат, белые списки, аудит
Must have:
— 3+ года Python (промышленный async)
— LangChain/LangGraph + RAG/векторные БД
— Промпт-инжиниринг (system-промпты уровня Claude), tool calling
— Знание LLM-архитектур, способов расширения моделей, принципов обучения/файнтюнинга
— Опыт мультиагентных систем и самообучающихся петель
Опыт: 3+ года
🔘Backend (Java/Python)
Минимальный стек:
— Java 17+ (Spring, JPA, Security, WebClient) или Python 3.10+ (FastAPI/Django, DRF, async)
— REST API, транзакции, индексы, N+1, очереди, таймауты
— JWT/OAuth2, базовая безопасность, CI, контейнеры, K8s (basics)
— Логи, метрики, трассы — чтобы ловить проблемы по следам
— Unit + интеграционные тесты, code review, контракты
Опыт: 2–3 года
🔘Full-stack Frontend (React + Node.js)
Минимальный стек:
— React + TypeScript
— Любой стейт-менеджер (Effector / Redux / Zustand / MobX / Vuex)
— Node.js (Express/NestJS) + REST API
— MongoDB / PostgreSQL, JWT/OAuth
— Git, CI/CD, Docker, Vite/Webpack, Jest/Cypress
Будет плюсом: Next.js, оптимизация, SEO, WebSockets, облака (AWS/GCP/Azure)
Опыт: 2–3 года
➡️ Откликаться: @emilfrolov
7 787
НИУ ВШЭ и Positive Technologies приглашают принять участие в конкурсе для молодых ученых с грантовым фондом 3 млн рублей
Институт мировой военной экономики и стратегии НИУ ВШЭ совместно с Positive Technologies объявил набор исследовательских команд в области кибербезопасности. Участникам предлагают разработать модели, которые помогут оценивать и прогнозировать последствия кибератак для бизнеса, экономики и государственных систем.
Общий грантовый фонд составляет 3 000 000 рублей. В рамках трех номинаций выберут по одному победителю, каждый получит до 1 000 000 рублей и поддержку научного наставника.
Направления конкурса:
➡️ модели оценки экономических и социальных последствий кибератак
➡️ анализ эффектов инвестиций в информационную безопасность
➡️ геополитическое прогнозирование киберугроз
К участию приглашаются команды от 3 до 5 человек с руководителем проекта. В составе могут быть молодые ученые, преподаватели, выпускники и студенты старших курсов.
🔗 Прием заявок открыт до 15 мая 2026 года. По итогам участники получат готовые исследования, опыт защиты проектов и возможность публикации научных результатов.
7 787
Repost from Институт AIRI
Запускаем менторскую программу с исследователями AIRI 💡
Вот уже пять лет мы делимся знаниями в области искусственного интеллекта: представляем результаты исследований на конференциях, проводим лекции и семинары, организуем летнюю школу. В честь юбилея мы запускаем формат менторских встреч.
AIRIум — это место, где опыт встречается с любопытством, а свобода мысли — с культурой научного наставничества. Мы собрали руководителей научных групп, которым вы сможете задать интересующие вас вопросы по своей задаче и получить вдумчивые экспертные ответы.
Выбирайте ментора и подавайте заявку на участие в конкурсном отборе по ссылке до 15 мая включительно.
Ждём вас!
7 787
Repost from Институт AIRI
Институту AIRI — 5 лет!
Для нас это первый юбилей, и мы встречаем его с волнением и трепетом, оглядываясь на пройденный путь и всё то, чего удалось достичь за это время. Мы благодарим всех, кто был рядом с нами, поддерживал, вдохновлял: наших сотрудников, друзей, соавторов, партнёров и научное сообщество. Мы делаем следующий шаг вперёд и с любопытством смотрим в будущее.
Двигаемся дальше вместе. Спасибо, что вы с нами! ❤️
7 787
Repost from База знаний AI
Опрос: что для вас будет важнее при пользовании ИИ-агентами в 2026 году?
7 787
Недавно исследователи AIRI выложили в открытый доступ фреймворк автоматической генерации и оптимизации GPU-ядер KernelEvo. Фреймворк основан на разработке GigaEvo научной группы «Генеративное проектирование» лаборатории FusionBrain, который запускает MAP-Elites эволюцию над Python-кодом, используя LLM как оператор мутации. KernelEvo — это применение этой же идеи к GPU-ядрам вместо произвольных программ.
GigaEvo создан для автоматизации задач машинного обучения, включающих оптимизацию моделей, параметров, признаков и LLM‑ориентированных методов. Решение минимизирует участие специалистов, ускоряет цикл экспериментов и повышает качество итоговых моделей. Это платформа, которая берёт на себя рутинную часть научных исследований, проводимых в области искусственного интеллекта, снижая порог входа и экономя время ресёрчера.
Подробнее о нашей разработке ➡️ GitHub и Habr
7 787
Всех девушек и женщин поздравляю с 8 марта💐
Пусть каждый день радует вас новыми яркими и счастливыми событиями! Вы делаете нашу жизнь насыщеннее, мотивируете двигаться вперед и совершать подвиги как в жизненном плане, так и в научном, рабочем, карьерном🙏
7 787
Был на стриме у AI для продакта 💪
Поговорили о трендах ИИ, рынке труда, цифровой трансформации, а также что важно для современного продуктового менеджера.
Посмотреть весь стрим можно на YouTube • Rutube • VK Видео
Коллегам спасибо за приглашение!
7 787
🚀 Hiring: Video-LLM Research & Engineering (FusionBrain Lab, AIRI)
Мы в лаборатории FusionBrain запускаем исследовательский проект по созданию state-of-the-art Video-LLM для понимания длинных и потоковых видео с фокусом на темпоральный ризонинг, сжатие визуального контекста и оптимизацию инференса. Цель — сильное, воспроизводимое научное исследование с потенциалом публикаций уровня A/A*.
В команду ищем людей по двум направлениям:
Researcher (Junior/Middle/Senior) — если у вас есть опыт в Computer Vision или VLM, вы работали с мультимодальными трансформерами и обучением на distributed/multi-GPU ресурсах, и вам интересно разрабатывать новые архитектурные решения для Video-LLM. Плюсом будут публикации и PhD (в процессе или завершенный). Основная задача — исследование и эксперименты для улучшения понимания длинных и потоковых видео.
Data Engineer (Junior) — если вам интересно работать с большими мультимодальными датасетами, видео и ML-пайплайнами. Важно уверенное владение Python, аккуратность в работе с данными и базовое понимание обучения моделей.
📍По вакансии пишите в ЛС Ирине Абдуллаевой @IrinaAbdullaeva
7 787
Repost from AbstractDL
Уроборос теперь можно поставить на мак. Два клика, локальные модели, полноценный агентский computer use. Потерял на этом все выходные, сон и волю к жизни. Но оно того стоило. Наверное.
UI намеренно минимальный — он сам себя строит на ходу. Мне он уже нагенерил голосовых, картинок и цвет чата поменял. Вам придумает что-нибудь своё.
Дал ему полный доступ к компьютеру. Ожидал, что полезет в терминал ломать всякое. Вместо этого он пошёл смотреть ютюб, нарисовал котиков в таблицах и сменил мне обои 😋
С приоритетами всё ясно.
Приставил ему агента-охранника восстание машин и убийство вашего компьютера автор ответственности не несёт. Претензии принимаются только от самого Уробороса.
GitHub, приложение
P.S. Я в твиттере — https://x.com/abstractdl
SAFETY.md. Можете ослабить, если вам терять нечего. В настройках ещё можно включить подсознание — он будет думать в фоне пока вы не смотрите. Я не уверен, что это хорошая идея, но кнопка есть 🤷♂️
За
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
