Complete AI

Ir al canal en Telegram

Меня зовут Андрей Кузнецов Руковожу управлением в Sber AI, построил успешную лабораторию FusionBrain в AIRI, один из основателей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Rusia79 619 Tecnologías y Aplicaciones14 329

7 788

Suscriptores

+124 horas

+87 días

-530 días

2 491

Visitas de la publicación

~ 1 05924 horas

~ 1 27848 horas

31.99%

Tasa de compromiso

Sin datos

Mensajes por día

Ads index

beta

Archivo de publicaciones

7 789

Вдруг вчера кому-то было мало инсайтов про K3 предлагаю ещё такой коротенький почитать😉 https://sebastianraschka.com/blog/2026/kimi-k3-architecture-notes.html

7 789

🤖 Ищем менеджера проектов в ИИ-стройку Мы — SberAI, команда, которая строит будущее строительства с помощью искусственного интеллекта. Совмещаем исследования и реальное применение: автоматизируем анализ и составление строительной документации, извлекаем данные из BIM-моделей, создаём генеративные решения для архитектуры и дизайна. Ищем человека, который сведёт воедино науку, продукт и стройку. Чем предстоит заниматься → Управлять проектами от идеи до внедрения: планировать сроки, ресурсы, риски и зависимости → Синхронизировать усилия исследователей (DS, ML-инженеров) и продуктовой команды — переводить научные разработки в рабочие решения → Работать с заказчиками из строительной отрасли: понимать их процессы, формализовывать требования, контролировать качество поставки → Вести проектную документацию и обеспечивать прозрачность для всех стейкхолдеров → Анализировать рынок строительных ИИ-решений: конкуренты, тренды, регуляторика, потребности заказчиков → Формулировать бизнес-требования на основе анализа рынка и обратной связи — переводить инсайты в задачи для команды → Определять ключевые метрики: технические (точность, скорость инференса), продуктовые (вовлечённость, retention) и бизнесовые (экономия времени, снижение ошибок) → Готовить аналитику для руководства: эффективность внедрённых решений, прогнозы, сравнение с рынком Что важно для нас ✅ Опыт управления проектами в технических командах 3+ лет — желательно в продуктах с ИИ-компонентом или сложной доменной логикой ✅ Понимание жизненного цикла ML-проектов: от сбора данных до production-инференса ✅ Знакомство со строительной отраслью или готовность быстро погружаться: BIM, проектная документация, СП, стадии строительного цикла ✅ Гибкость: умение работать и в условиях исследовательской неопределённости, и в режиме продуктовой поставки ✅ Коммуникация: умение объяснять сложные технические вещи нетехническим стейкхолдерам и наоборот Откликнуться — пишите в личку Евгении Газарян @jjg26

7 789

Интегрально инсайты из K3: 2.78Т параметров, 896 экспертов, 1M контекст. Под капотом — системная оптимизация на каждом уровне стека: 1️⃣ SiTU-GLU — замена SwiGLU с мягким насыщением активаций. Именно это позволило безопасно масштабировать sparsity до 56× (16 из 896 экспертов). Без этого приёма модель бы просто взорвалась 2️⃣ Quantile Balancing — балансировка нагрузки экспертов за один forward pass через квантили. Полностью убрали auxiliary loss, как следствие чище градиенты, быстрее сходимость 3️⃣ MoonViT-V2 — vision encoder обучен с нуля через next-token prediction. Контрастивный pre-training (SigLIP/CLIP) оказался нестабильным при joint optimization 4️⃣ AgentENV — microVM-песочницы вместо контейнеров для RL. Firecracker VM: checkpoint за 133ms, resume за 49ms, memory overcommit 6.5×51.2 млн sandbox'ов за тренинг 5️⃣ MoonEP — expert parallelism с доказуемой верхней границей redundant-экспертов. Обучение работает 100% времени без остановок на балансировку

7 789

И техрепорт вдогонку https://github.com/MoonshotAI/Kimi-K3/blob/main/k3_tech_report.pdf

7 789

Kimi как обещали зарелизили в опенсурс веса своей самой крупной модели K3 - 2.8T параметров🔥 Осталось домашний комп чуть обновить и можно тестировать https://huggingface.co/moonshotai/Kimi-K3

7 789

Вот и price plan доехал от Qwen Cloud. По современным меркам очень демократичный) https://www.qwencloud.com/pricing/token-plan

7 789

⚡️Новости опенсорса 👉GLM-5.2 ✅ Almost Opus-level 👉Kimi-K3 ✅ Almost Fable-level 👉Qwen-3.8 🔜 2.4T, Expected to beat Opus 👉Deepseek V4 GA 🔜 $0.0028/M Expected to beat Opus 👉Minimax-M3-Pro 🔜 3T, Expected to be Fable-level 👉GLM-5.5 🔜 Expected to beat Opus

7 789

Интересная неделя намечается😉

7 789

Вчера вечером был на ивенте ML&DS Offstage от Ozon Tech, участвовал в круглом столе «Агенты: от исследований к бизнес-внедрениям», где модератором был мой хороший друг Алексей Обровец. Очень интересные спикеры! Вроде бы стандартные и наболевшие вопросы, но так много разных содержательных мнений. Конечно, больше всего волнуются за молодое поколение, подходы к образованию в эпоху агентной экономики — всё это очень важно и нужно постоянно анализировать и развивать. А главное, «не бояться», потому что любые технологические изменения направлены на то, чтобы сделать жизнь лучше. Проблемы галлюцинаций, предсказуемости и объяснимости подведения моделей и агентов ещё находятся в глубокой фазе исследований, но как и любым инструментом агентами надо учиться пользоваться себе во благо, и мы явно идём правильным путём. Ну и фотоотчёт😎

7 789

Начинаем первый день на ICML 2026💪 Довольно интересный доклад про способ «обогащения» рага графом темпоральных знаний с разными режимами работы, типа извлечения субграфа на лету через прерывания в диалоге. https://arxiv.org/abs/2510.13590

7 789

Всем привет! Выложили нашу работу “Does VLA Even Know the Basics?” в Daily Papers на Hugging Face 🤗 В статье мы задаёмся простым, но пока почти не изученным вопросом: есть ли в VLA-моделях commonsense знания о мире? 📚 ⚡️Мы предлагаем Act2Answer: бенчмарк, где VLA модель отвечает на вопросы не текстом, а действием - кладёт куб на правильный вариант. Проверили 7 VLA и 9 VLM моделей на 12 категориях. 💡Интересные инсайты из работы: → VLA хорошо понимают примитивные концепты по типу Цвета и Формы → На более сложных категориях (Эмоции, Животные, Симметрия, Время, Счет, История) у VLA сильный дроп в сравнении с VLM → Знания есть в весах VLA моделей, однако они не транслируются в действия → Котрейнинг на VL данных хорошо помогает сохранять знания → SFT/RL файтюнинг на downstream роботикс задачах дергадирует знания Поддержите нас апвоутом пожалуйста ❤️

7 789

3️⃣9️⃣

7 789

Repost from ИИ и роботы в стройке

Посмотрела выступление Анастасии Анциферовой, исполнительного директора по исследованию данных центра исследований генеративного ИИ Сбера, На митапе у VisionLabs она рассказала о последних разработках Сбера и AIRI для автоматизации проектирования зданий 🟣 Автоматизация генерации массингов CoMa — метод генерация массингов по текстовым требованиям с описанием ограничений, координатам участка и изображению окружения. На выходе пользователь получает 3D-геометрию здания в формате JSON. 🟣 Генерация планировок Для генерации планировок AIRI улучшила диффузионную модель HouseDiffusion (она по графу связности комнат генерирует координаты стен, но не учитывает фиксированные элементы, а еще иногда оставляет пустые пространства между комнатами). AIRI представила HouseDiffusion++. Базовую модель дообучили на датасете из 62 тысяч планировок, добавили кросс-аттеншн-блоки, которые нужны, чтобы модель не двигала фиксированные элементы (вентиляционные шахты, окна или двери), а также возможность экспорта результата в Revit.

«Сейчас в основном в области планировок мы занимаемся генерацией жилых зданий, но на следующий год у нас запланировано расширение до создания планировок для общественных пространств, школ, больниц».

«По поводу удобства планировок у нас сейчас есть направление меблировки: мы учимся расставлять мебель так, чтобы агенты, которые ходят по квартире, эмулируя поведение людей, тратили минимальное количество шагов на типичные перемещения».

🟣 Работа с BIM-моделями IFC-QA — бенчмарк для проверки языковых моделей на понимание BIM-файлов, В нем 99 вопросов пяти уровней сложности. Результаты показали: лучшая модель отвечает правильно только в 68% случаев. На простых вопросах точность достигает 90%, но на сложных, требующих многошаговых рассуждений, падает. Также у AIRI есть разработка Chat with IFC, где пользователь может получать ответы по IFC-файлу, просто в обычном чате с ИИ. Интересная штука — я узнаю, есть ли открытая работа. 🟣 Документация и чертежи

«Документация — сейчас самая горячая тема»

Анастасия отметила, что больше всего внутренних и внешних запросов приходит на автоматизацию работы с документацией. Здесь основные направления: OCR (распознавание символов), RAG и работа с базами документов через ИИ-агентов. Основная сложность — учет нормативки: новые градостроительные нормы принимаются буквально каждый день. В следующих постах расскажу про метод CoMa.

7 789

ИИ уже меняет бизнес — вопрос только в том, кто им управляет? Магистратура «Управление внедрением ИИ в бизнес» от МИФИ и «Школы 21» — для тех, кто хочет быть этим человеком. Фокус обучения: ➡️ живые сценарии — куда встроить ИИ, чтобы было быстрее, дешевле, эффективнее ➡️ управление продуктами и понимание технологий, чтобы разговаривать с разработчиками на одном языке ➡️ реальные проекты от компаний прямо во время учёбы А в конце — диплом МИФИ и портфолио, с которым можно идти на собеседование! Все подробности и заявка — на сайте.

7 789

19 сентября состоится Practical ML Conf — хардовая конференция по практическому применению ML, где будем обсуждать технологии, которые уже работают! Я состою в программном комитете уже не перый год, буду рад видеть вас лично и познакомиться с вашими проектами. Программный комитет отбирает доклады, опираясь на четыре основных критерия: пользу и новизну для сообщества, применимость на практике и хардовый уровень сложности. Что планируем: ⚪ Эксперты программного комитета дадут советы по структуре и содержанию доклада ⚪ Прогоны материала вместе с тренером по публичным выступлениям ⚪ Нетворкинг с сильным ML-комьюнити ⚪ Промо спикеров и докладов до и после конференции ⚪ И самое главное — вы сможете стать частью главной конференции Яндекса по машинному обучению Приём докладов заканчивается сегодня! Подписывайтесь: 🔗 @Practical_ML_Conf

7 789

Стройте LLM-системы, а не просто вызывайте API Записывайтесь на новый поток курса LLM-инженер от AI Talent Hub и GIGASCHOOL 🎓 Сейчас уже недостаточно просто знать RAG, рынок ищет тех, кто умеет собирать сложные AI-системы и доводить их до продакшена. Поэтому коллеги пересобрали программу, сохранили фундаментальную базу и усилили практическую часть. Добавили сквозной проект с первого дня — вы собираете end-to-end LLM-систему под свой домен от адаптации модели до продакшена. В программе production-инференс, управление нагрузкой и стоимостью, observability и LLMOps, system design, безопасность и AI Red Teaming. Что окажется в вашем GitHub после курса: ➡️ Опыт дообучения LLM/энкодер под домен ➡️ RAG над корпоративной базой ➡️ Мультиагентная система ➡️ Production-сервис в Docker ➡️ Observability и отчет по безопасности

Лекции читают практики из крупных AI-команд: 👤 Роман Соломатин (NLP Researcher, Сбер) 👤 Александр Потехин (NLP Lead, X5 Tech) 👤 Кристина Желтова (Директор по разработке моделей, Газпромбанк) 👤 Евгений Кокуйкин (CEO HiveTrace)

До четверга самая низкая стоимость, дальше будет расти. Изучайте программу и регистрируйтесь на курс!

7 789

Всем привет! Мы с командой в рамках образовательного проекта решили провести исследование, как клиенты пользуются инструментами инвестирования для проработки идеи нового продукта автоматических инвестиций, использующего механику оплаты ЖКХ, налогов, кредитов и прочих платежей. Для исследования сделали короткий анонимный опрос, который займёт не дольше одной минуты, но будет нам очень полезным. Если вы поможете и внесёте свой вклад — вкупе это принесёт супер пользу, а итогами опроса поделюсь🙏 Ссылка на опрос https://public.oprosso.sberbank.ru/p/jtmguucn

7 789

Repost from Ivan Oseledets’ Channel

Второй раз получаю премию Билайна AI AWARDS — в этом году в номинации «Личный вклад в развитие ИИ». Наверное, всё делаем правильно, раз наш вклад и сама нейросеть отмечает. Будем двигаться дальше.

7 789

Repost from N/a

А вы знали, что методы генерации видео можно использовать для прогноза погоды? Наша команда разработала Marchuk — первую в России генеративную модель для прогнозирования климатических рисков. Мы взяли диффузионные трансформеры (которые обычно генерируют изображения и видео) и научили их предсказывать погоду. И вот что получилось: ✔️Субсезонный диапазон: Marchuk позволяет строить прогнозы на 15-30 дней вперёд ✔️Компактная модель: имея всего 276M параметров, она показывает сопостовимое качество с 1,6B аналогом ✔️Доступность: Код и веса модели в открытом доступе, а запустить ее можно всего на одной видеокарте или в Colab 💡 Имя модели — дань уважения математику Гурию Ивановичу Марчуку, заложившему основы численного моделирования климатических процессов. 👇 Читайте подробности о разработке по ссылкам: ArXiv | Project Page | GitHub | Colab | HF

7 789

В связи с расширением моей команды по разработке автономных универсальных ИИ-агентов в Сбере ищу сотрудников! Чем мы занимаемся: — Разрабатываем AI-агенты с адаптивным поведением и полной автономией — они самостоятельно решают задачи, учатся на данных и масштабируются в реальных сценариях (проектирование ядра агента, работа с «глубокими агентами», внедрение самообучающих петлей, построение мультиагентных систем) — Создаем инструменты для развертывания и мониторинга моделей — от бесшовного деплоя в продакшен до автоматизированного отслеживания производительности, ошибок и оптимизации Кого ждём: 🔘Middle/Senior AI Agent Engineer (Python) Минимальный стек: — Python 3.10+ (async, LangChain/LangGraph — StateGraph, чекпоинты, стриминг) — LLM-провайдеры (OpenAI, Anthropic, OpenRouter), tool use, MCP для API/OAuth2 — Memory/RAG: векторные БД (Qdrant, Milvus, PGVector), гибридный поиск, факт-извлечение — Мультиагенты: оркестрация (CrewAI-подобные), циклы восприятие→действие→рефлексия, самообучение — Файловые системы как контекст-менеджеры, Docker, облака (AWS Bedrock, Azure) — Безопасность: sandbox, safety-агенты, откат, белые списки, аудит Must have: — 3+ года Python (промышленный async) — LangChain/LangGraph + RAG/векторные БД — Промпт-инжиниринг (system-промпты уровня Claude), tool calling — Знание LLM-архитектур, способов расширения моделей, принципов обучения/файнтюнинга — Опыт мультиагентных систем и самообучающихся петель Опыт: 3+ года 🔘Backend (Java/Python) Минимальный стек: — Java 17+ (Spring, JPA, Security, WebClient) или Python 3.10+ (FastAPI/Django, DRF, async) — REST API, транзакции, индексы, N+1, очереди, таймауты — JWT/OAuth2, базовая безопасность, CI, контейнеры, K8s (basics) — Логи, метрики, трассы — чтобы ловить проблемы по следам — Unit + интеграционные тесты, code review, контракты Опыт: 2–3 года 🔘Full-stack Frontend (React + Node.js) Минимальный стек: — React + TypeScript — Любой стейт-менеджер (Effector / Redux / Zustand / MobX / Vuex) — Node.js (Express/NestJS) + REST API — MongoDB / PostgreSQL, JWT/OAuth — Git, CI/CD, Docker, Vite/Webpack, Jest/Cypress Будет плюсом: Next.js, оптимизация, SEO, WebSockets, облака (AWS/GCP/Azure) Опыт: 2–3 года ➡️ Откликаться: @emilfrolov