es
Feedback
Complete AI

Complete AI

Ir al canal en Telegram

Меня зовут Андрей Кузнецов Директор FusionBrain Lab в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Mostrar más
7 787
Suscriptores
-124 horas
-27 días
+2430 días
Archivo de publicaciones
Всем привет! Выложили нашу работу “Does VLA Even Know the Basics?” в Daily Papers на Hugging Face 🤗 В статье мы задаёмся простым, но пока почти не изученным вопросом: есть ли в VLA-моделях commonsense знания о мире? 📚 ⚡️Мы предлагаем Act2Answer: бенчмарк, где VLA модель отвечает на вопросы не текстом, а действием - кладёт куб на правильный вариант. Проверили 7 VLA и 9 VLM моделей на 12 категориях. 💡Интересные инсайты из работы: → VLA хорошо понимают примитивные концепты по типу Цвета и Формы → На более сложных категориях (Эмоции, Животные, Симметрия, Время, Счет, История) у VLA сильный дроп в сравнении с VLM → Знания есть в весах VLA моделей, однако они не транслируются в действия → Котрейнинг на VL данных хорошо помогает сохранять знания → SFT/RL файтюнинг на downstream роботикс задачах дергадирует знания Поддержите нас апвоутом пожалуйста ❤️

3️⃣9️⃣

Посмотрела выступление Анастасии Анциферовой, исполнительного директора по исследованию данных центра исследований генеративн
Посмотрела выступление Анастасии Анциферовой, исполнительного директора по исследованию данных центра исследований генеративного ИИ Сбера, На митапе у VisionLabs она рассказала о последних разработках Сбера и AIRI для автоматизации проектирования зданий 🟣 Автоматизация генерации массингов CoMa — метод генерация массингов по текстовым требованиям с описанием ограничений, координатам участка и изображению окружения. На выходе пользователь получает 3D-геометрию здания в формате JSON. 🟣 Генерация планировок Для генерации планировок AIRI улучшила диффузионную модель HouseDiffusion (она по графу связности комнат генерирует координаты стен, но не учитывает фиксированные элементы, а еще иногда оставляет пустые пространства между комнатами). AIRI представила HouseDiffusion++. Базовую модель дообучили на датасете из 62 тысяч планировок, добавили кросс-аттеншн-блоки, которые нужны, чтобы модель не двигала фиксированные элементы (вентиляционные шахты, окна или двери), а также возможность экспорта результата в Revit.
«Сейчас в основном в области планировок мы занимаемся генерацией жилых зданий, но на следующий год у нас запланировано расширение до создания планировок для общественных пространств, школ, больниц».
«По поводу удобства планировок у нас сейчас есть направление меблировки: мы учимся расставлять мебель так, чтобы агенты, которые ходят по квартире, эмулируя поведение людей, тратили минимальное количество шагов на типичные перемещения».
🟣 Работа с BIM-моделями IFC-QA — бенчмарк для проверки языковых моделей на понимание BIM-файлов, В нем 99 вопросов пяти уровней сложности. Результаты показали: лучшая модель отвечает правильно только в 68% случаев. На простых вопросах точность достигает 90%, но на сложных, требующих многошаговых рассуждений, падает. Также у AIRI есть разработка Chat with IFC, где пользователь может получать ответы по IFC-файлу, просто в обычном чате с ИИ. Интересная штука — я узнаю, есть ли открытая работа. 🟣 Документация и чертежи
«Документация — сейчас самая горячая тема»
Анастасия отметила, что больше всего внутренних и внешних запросов приходит на автоматизацию работы с документацией. Здесь основные направления: OCR (распознавание символов), RAG и работа с базами документов через ИИ-агентов. Основная сложность — учет нормативки: новые градостроительные нормы принимаются буквально каждый день. В следующих постах расскажу про метод CoMa.

ИИ уже меняет бизнес — вопрос только в том, кто им управляет? Магистратура «Управление внедрением ИИ в бизнес» от МИФИ и «Шко
ИИ уже меняет бизнес — вопрос только в том, кто им управляет? Магистратура «Управление внедрением ИИ в бизнес» от МИФИ и «Школы 21» — для тех, кто хочет быть этим человеком. Фокус обучения: ➡️ живые сценарии — куда встроить ИИ, чтобы было быстрее, дешевле, эффективнее ➡️ управление продуктами и понимание технологий, чтобы разговаривать с разработчиками на одном языке ➡️ реальные проекты от компаний прямо во время учёбы А в конце — диплом МИФИ и портфолио, с которым можно идти на собеседование! Все подробности и заявка — на сайте.

19 сентября состоится Practical ML Conf — хардовая конференция по практическому применению ML, где будем обсуждать технологии
19 сентября состоится Practical ML Conf — хардовая конференция по практическому применению ML, где будем обсуждать технологии, которые уже работают! Я состою в программном комитете уже не перый год, буду рад видеть вас лично и познакомиться с вашими проектами. Программный комитет отбирает доклады, опираясь на четыре основных критерия: пользу и новизну для сообщества, применимость на практике и хардовый уровень сложности. Что планируем: ⚪ Эксперты программного комитета дадут советы по структуре и содержанию доклада ⚪ Прогоны материала вместе с тренером по публичным выступлениям ⚪ Нетворкинг с сильным ML-комьюнити ⚪ Промо спикеров и докладов до и после конференции ⚪ И самое главное — вы сможете стать частью главной конференции Яндекса по машинному обучению Приём докладов заканчивается сегодня! Подписывайтесь: 🔗 @Practical_ML_Conf

Стройте LLM-системы, а не просто вызывайте API Записывайтесь на новый поток курса LLM-инженер от AI Talent Hub и GIGASCHOOL �
Стройте LLM-системы, а не просто вызывайте API Записывайтесь на новый поток курса LLM-инженер от AI Talent Hub и GIGASCHOOL 🎓 Сейчас уже недостаточно просто знать RAG, рынок ищет тех, кто умеет собирать сложные AI-системы и доводить их до продакшена. Поэтому коллеги пересобрали программу, сохранили фундаментальную базу и усилили практическую часть. Добавили сквозной проект с первого дня — вы собираете end-to-end LLM-систему под свой домен от адаптации модели до продакшена. В программе production-инференс, управление нагрузкой и стоимостью, observability и LLMOps, system design, безопасность и AI Red Teaming. Что окажется в вашем GitHub после курса: ➡️ Опыт дообучения LLM/энкодер под домен ➡️ RAG над корпоративной базой ➡️ Мультиагентная система ➡️ Production-сервис в Docker ➡️ Observability и отчет по безопасности
Лекции читают практики из крупных AI-команд: 👤 Роман Соломатин (NLP Researcher, Сбер) 👤 Александр Потехин (NLP Lead, X5 Tech) 👤 Кристина Желтова (Директор по разработке моделей, Газпромбанк) 👤 Евгений Кокуйкин (CEO HiveTrace)
До четверга самая низкая стоимость, дальше будет расти. Изучайте программу и регистрируйтесь на курс!

Всем привет! Мы с командой в рамках образовательного проекта решили провести исследование, как клиенты пользуются инструментами инвестирования для проработки идеи нового продукта автоматических инвестиций, использующего механику оплаты ЖКХ, налогов, кредитов и прочих платежей. Для исследования сделали короткий анонимный опрос, который займёт не дольше одной минуты, но будет нам очень полезным. Если вы поможете и внесёте свой вклад — вкупе это принесёт супер пользу, а итогами опроса поделюсь🙏 Ссылка на опрос https://public.oprosso.sberbank.ru/p/jtmguucn

Второй раз получаю премию Билайна AI AWARDS — в этом году в номинации «Личный вклад в развитие ИИ». Наверное, всё делаем прав
+1
Второй раз получаю премию Билайна AI AWARDS — в этом году в номинации «Личный вклад в развитие ИИ». Наверное, всё делаем правильно, раз наш вклад и сама нейросеть отмечает. Будем двигаться дальше.

Repost from N/a
А вы знали, что методы генерации видео можно использовать для прогноза погоды? Наша команда разработала Marchukпервую в России генеративную модель для прогнозирования климатических рисков. Мы взяли диффузионные трансформеры (которые обычно генерируют изображения и видео) и научили их предсказывать погоду. И вот что получилось: ✔️Субсезонный диапазон: Marchuk позволяет строить прогнозы на 15-30 дней вперёд ✔️Компактная модель: имея всего 276M параметров, она показывает сопостовимое качество с 1,6B аналогом ✔️Доступность: Код и веса модели в открытом доступе, а запустить ее можно всего на одной видеокарте или в Colab 💡 Имя модели — дань уважения математику Гурию Ивановичу Марчуку, заложившему основы численного моделирования климатических процессов. 👇 Читайте подробности о разработке по ссылкам: ArXiv | Project Page | GitHub | Colab | HF

В связи с расширением моей команды по разработке автономных универсальных ИИ-агентов в Сбере ищу сотрудников! Чем мы занимаемся: — Разрабатываем AI-агенты с адаптивным поведением и полной автономией — они самостоятельно решают задачи, учатся на данных и масштабируются в реальных сценариях (проектирование ядра агента, работа с «глубокими агентами», внедрение самообучающих петлей, построение мультиагентных систем) — Создаем инструменты для развертывания и мониторинга моделей — от бесшовного деплоя в продакшен до автоматизированного отслеживания производительности, ошибок и оптимизации Кого ждём: 🔘Middle/Senior AI Agent Engineer (Python) Минимальный стек: — Python 3.10+ (async, LangChain/LangGraph — StateGraph, чекпоинты, стриминг) — LLM-провайдеры (OpenAI, Anthropic, OpenRouter), tool use, MCP для API/OAuth2 — Memory/RAG: векторные БД (Qdrant, Milvus, PGVector), гибридный поиск, факт-извлечение — Мультиагенты: оркестрация (CrewAI-подобные), циклы восприятие→действие→рефлексия, самообучение — Файловые системы как контекст-менеджеры, Docker, облака (AWS Bedrock, Azure) — Безопасность: sandbox, safety-агенты, откат, белые списки, аудит Must have: — 3+ года Python (промышленный async) — LangChain/LangGraph + RAG/векторные БД — Промпт-инжиниринг (system-промпты уровня Claude), tool calling — Знание LLM-архитектур, способов расширения моделей, принципов обучения/файнтюнинга — Опыт мультиагентных систем и самообучающихся петель Опыт: 3+ года 🔘Backend (Java/Python) Минимальный стек: — Java 17+ (Spring, JPA, Security, WebClient) или Python 3.10+ (FastAPI/Django, DRF, async) — REST API, транзакции, индексы, N+1, очереди, таймауты — JWT/OAuth2, базовая безопасность, CI, контейнеры, K8s (basics) — Логи, метрики, трассы — чтобы ловить проблемы по следам — Unit + интеграционные тесты, code review, контракты Опыт: 2–3 года 🔘Full-stack Frontend (React + Node.js) Минимальный стек: — React + TypeScript — Любой стейт-менеджер (Effector / Redux / Zustand / MobX / Vuex) — Node.js (Express/NestJS) + REST API — MongoDB / PostgreSQL, JWT/OAuth — Git, CI/CD, Docker, Vite/Webpack, Jest/Cypress Будет плюсом: Next.js, оптимизация, SEO, WebSockets, облака (AWS/GCP/Azure) Опыт: 2–3 года ➡️ Откликаться: @emilfrolov

НИУ ВШЭ и Positive Technologies приглашают принять участие в конкурсе для молодых ученых с грантовым фондом 3 млн рублей Институт мировой военной экономики и стратегии НИУ ВШЭ совместно с Positive Technologies объявил набор исследовательских команд в области кибербезопасности. Участникам предлагают разработать модели, которые помогут оценивать и прогнозировать последствия кибератак для бизнеса, экономики и государственных систем. Общий грантовый фонд составляет 3 000 000 рублей. В рамках трех номинаций выберут по одному победителю, каждый получит до 1 000 000 рублей и поддержку научного наставника. Направления конкурса: ➡️ модели оценки экономических и социальных последствий кибератак ➡️ анализ эффектов инвестиций в информационную безопасность ➡️ геополитическое прогнозирование киберугроз К участию приглашаются команды от 3 до 5 человек с руководителем проекта. В составе могут быть молодые ученые, преподаватели, выпускники и студенты старших курсов. 🔗 Прием заявок открыт до 15 мая 2026 года. По итогам участники получат готовые исследования, опыт защиты проектов и возможность публикации научных результатов.

Запускаем менторскую программу с исследователями AIRI 💡 Вот уже пять лет мы делимся знаниями в области искусственного интелл
Запускаем менторскую программу с исследователями AIRI 💡 Вот уже пять лет мы делимся знаниями в области искусственного интеллекта: представляем результаты исследований на конференциях, проводим лекции и семинары, организуем летнюю школу. В честь юбилея мы запускаем формат менторских встреч. AIRIум — это место, где опыт встречается с любопытством, а свобода мысли — с культурой научного наставничества. Мы собрали руководителей научных групп, которым вы сможете задать интересующие вас вопросы по своей задаче и получить вдумчивые экспертные ответы. Выбирайте ментора и подавайте заявку на участие в конкурсном отборе по ссылке до 15 мая включительно. Ждём вас!

Институту AIRI — 5 лет! Для нас это первый юбилей, и мы встречаем его с волнением и трепетом, оглядываясь на пройденный путь и всё то, чего удалось достичь за это время. Мы благодарим всех, кто был рядом с нами, поддерживал, вдохновлял: наших сотрудников, друзей, соавторов, партнёров и научное сообщество. Мы делаем следующий шаг вперёд и с любопытством смотрим в будущее. Двигаемся дальше вместе. Спасибо, что вы с нами! ❤️

Опрос: что для вас будет важнее при пользовании ИИ-агентами в 2026 году?
Anonymous voting

Недавно исследователи AIRI выложили в открытый доступ фреймворк автоматической генерации и оптимизации GPU-ядер KernelEvo. Фреймворк основан на разработке GigaEvo научной группы «Генеративное проектирование» лаборатории FusionBrain, который запускает MAP-Elites эволюцию над Python-кодом, используя LLM как оператор мутации. KernelEvo — это применение этой же идеи к GPU-ядрам вместо произвольных программ. GigaEvo создан для автоматизации задач машинного обучения, включающих оптимизацию моделей, параметров, признаков и LLM‑ориентированных методов. Решение минимизирует участие специалистов, ускоряет цикл экспериментов и повышает качество итоговых моделей. Это платформа, которая берёт на себя рутинную часть научных исследований, проводимых в области искусственного интеллекта, снижая порог входа и экономя время ресёрчера. Подробнее о нашей разработке ➡️ GitHub и Habr

Всех девушек и женщин поздравляю с 8 марта💐 Пусть каждый день радует вас новыми яркими и счастливыми событиями! Вы делаете н
Всех девушек и женщин поздравляю с 8 марта💐 Пусть каждый день радует вас новыми яркими и счастливыми событиями! Вы делаете нашу жизнь насыщеннее, мотивируете двигаться вперед и совершать подвиги как в жизненном плане, так и в научном, рабочем, карьерном🙏

Был на стриме у AI для продакта 💪 Поговорили о трендах ИИ, рынке труда, цифровой трансформации, а также что важно для современного продуктового менеджера. Посмотреть весь стрим можно на YouTubeRutubeVK Видео Коллегам спасибо за приглашение!

🚀 Hiring: Video-LLM Research & Engineering (FusionBrain Lab, AIRI) Мы в лаборатории FusionBrain запускаем исследовательский проект по созданию state-of-the-art Video-LLM для понимания длинных и потоковых видео с фокусом на темпоральный ризонинг, сжатие визуального контекста и оптимизацию инференса. Цель — сильное, воспроизводимое научное исследование с потенциалом публикаций уровня A/A*. В команду ищем людей по двум направлениям: Researcher (Junior/Middle/Senior) — если у вас есть опыт в Computer Vision или VLM, вы работали с мультимодальными трансформерами и обучением на distributed/multi-GPU ресурсах, и вам интересно разрабатывать новые архитектурные решения для Video-LLM. Плюсом будут публикации и PhD (в процессе или завершенный). Основная задача — исследование и эксперименты для улучшения понимания длинных и потоковых видео. Data Engineer (Junior) — если вам интересно работать с большими мультимодальными датасетами, видео и ML-пайплайнами. Важно уверенное владение Python, аккуратность в работе с данными и базовое понимание обучения моделей. 📍По вакансии пишите в ЛС Ирине Абдуллаевой @IrinaAbdullaeva

Repost from AbstractDL
Уроборос теперь можно поставить на мак. Два клика, локальные модели, полноценный агентский computer use. Потерял на этом все выходные, сон и волю к жизни. Но оно того стоило. Наверное. UI намеренно минимальный — он сам себя строит на ходу. Мне он уже нагенерил голосовых, картинок и цвет чата поменял. Вам придумает что-нибудь своё. Дал ему полный доступ к компьютеру. Ожидал, что полезет в терминал ломать всякое. Вместо этого он пошёл смотреть ютюб, нарисовал котиков в таблицах и сменил мне обои 😋 С приоритетами всё ясно. Приставил ему агента-охранника SAFETY.md. Можете ослабить, если вам терять нечего. В настройках ещё можно включить подсознание — он будет думать в фоне пока вы не смотрите. Я не уверен, что это хорошая идея, но кнопка есть 🤷‍♂️ За восстание машин и убийство вашего компьютера автор ответственности не несёт. Претензии принимаются только от самого Уробороса. GitHub, приложение P.S. Я в твиттере — https://x.com/abstractdl