RnD ML Team
前往频道在 Telegram
4 041
订阅者
无数据24 小时
+27 天
+21530 天
帖子存档
4 040
+4
🛣 Нерешенные задачи для LLM
Или вечерний ресерч и как LLM не справились с несложной задачей составления маршрута.
💡 Идея
Захотелось как-то проехать по маршруту МКАД → ТТК → Садовое, то есть сделать три полных кольца. Зачем? Красивый GPS-трек в активностях часов. На картах тыкать 30-50+ точек было лень (если меньше, то навигатор предлагает маршрут "оптимальнее", но режет круги). Поэтому было решено отдать задачу этим вашим нейросетям.
🗯 Подробное условие
Сделай закольцованный маршрут МКАД → ТТК → Садовое. То есть нужно сделать полный круг по МКАД, потом сделать сделать съезд на ТТК и полный круг по ТТК, затем полный круг по Садовому. Точку старта возьми в любом удобном месте на МКАД (например: на Можайском шоссе). Финиш в любом месте после полного последнего круга садового кольца. Поставь столько точек, сколько нужно, чтобы маршрут закольцевался, а не искал оптимальный или короткий путь. Маршрут сделай ссылкой на Яндекс Картах.Что получилось? — Deepseek плохо: думал-думал, ссылку так нормально и не хотел выдавать. Пришлось мучать дольше всех. Итого прислал ссылку на 30+ рандомных точек, большая часть которых вообще не на дороге. — Qwen плохо: пришлось постоянно доуточнять условия, но что-то прислал (вообще и близко не похожее, но хотя бы в Москве). — ChatGPT получше: отказался делать ссылку в Я.Картах и требовал GPX-трек, ну ОК. Результат очень грубый, хоть и видно три кольца. — Gemini ужасно: решил, что 10 точек достаточно, в итоге получились полукруги на всех кольцах. ИМХО, хуже всех справился, да еще и за деньги. — Claude на версии Fable, конечно, не удалось на этой задаче потестить, но Opus был ближе всех. Хоть и неправильно местами, но он хотя бы предложил разбить на три колечка и сразу сказал, что у Яндекса могут быть проблемы с отображением в вебе >10 точек. А ещё он предложил сделать ссылки на 2ГИС и Гуглмапы. 2ГИС получилась битая, а гуглмапа относительно похожа на правду. Российские аналоги протестируйте сами) Бенчмарк? Можно ли из этого сделать бенчмарк планирования сложных маршрутов? Однозначно — да. Что-то похожее есть, но прямо на составление многосоставных сложных маршрутов сходу не нашлось. Ниже список актуальных бенчей на эту тему беглым поиском: MobilityBench (2026) — масштабируемый бенчмарк для оценки LLM-агентов в реальных задачах планирования маршрутов CityBench (2024) — первый комплексный бенчмарк для оценки способности LLM выступать в роли городской модели мира TransitLM (2026) — масштабный датасет и бенчмарк для обучения моделей генерации маршрутов общественного транспорта без использования карт GridRoute (2025) — бенчмарк для оценки LLM в задачах поиска пути на дискретной сетке карты #карты #деньги #трикольца
4 040
🛣 Нерешенные задачи для LLM
Или вечерний ресерч и как AI-сервисы не справились с несложной задачей составления маршрута.
💡 Идея
Захотелось как-то проехать по маршруту МКАД → ТТК → Садовое, то есть сделать три полных кольца. Зачем? Красивый GPS-трек в активностях часов. На картах тыкать 30-50+ точек было лень (если меньше, то навигатор предлагает маршрут "оптимальнее", но режет круги). Поэтому было решено отдать задачу этим вашим нейросетям.
🗯 Подробное условие
Сделай закольцованный маршрут МКАД → ТТК → Садовое. То есть нужно сделать полный круг по МКАД, потом сделать сделать съезд на ТТК и полный круг по ТТК, затем полный круг по Садовому. Точку старта возьми в любом удобном месте на МКАД (например: на Можайском шоссе). Финиш в любом месте после полного последнего круга садового кольца. Поставь столько точек, сколько нужно, чтобы маршрут закольцевался, а не искал оптимальный или короткий путь. Маршрут сделай ссылкой на Яндекс Картах.Что получилось? — Deepseek плохо: думал-думал, ссылку так нормально и не хотел выдавать. Пришлось мучать дольше всех. Итого прислал ссылку на 30+ рандомных точек, большая часть которых вообще не на дороге. — Qwen плохо: пришлось постоянно доуточнять условия, но что-то прислал (вообще и близко не похожее, но хотя бы в Москве). — ChatGPT получше: отказался делать ссылку в Я.Картах и требовал GPX-трек, ну ОК. Результат очень грубый, хоть и видно три кольца. — Gemini ужасно: решил, что 10 точек достаточно, в итоге получились полукруги на всех кольцах. ИМХО, хуже всех справился, да еще и за деньги. — Claude на версии Fable, конечно, не удалось потестить, но Opus был ближе всех. Хоть и неправильно местами, но он хотя бы предложил разбить на три колечка и сразу сказал, что у Яндекса могут быть проблемы с отображением в вебе >10 точек. А ещё он предложил сделать ссылки на 2ГИС и Гуглмапы. 2ГИС получилась битая, а гуглмапа относительно похожа на правду. Российские аналоги протестируйте сами😮💨 Бенчмарк? Можно ли из этого сделать бенчмарк планирования сложных маршрутов? Однозначно — да. Что-то похожее есть, но прямо на составление многосоставных сложных маршрутов сходу не нашлось. Ниже список актуальных бенчей на эту тему беглым поиском: MobilityBench (2026) — масштабируемый бенчмарк для оценки LLM-агентов в реальных задачах планирования маршрутов CityBench (2024) — первый комплексный бенчмарк для оценки способности LLM выступать в роли городской модели мира TransitLM (2026) — масштабный датасет и бенчмарк для обучения моделей генерации маршрутов общественного транспорта без использования карт GridRoute (2025) — бенчмарк для оценки LLM в задачах поиска пути на дискретной сетке карты #карты #деньги #трикольца
4 040
🏠 ЖКХ вы че творите??
Админ устал собирать квитанции и передавать показания. Каждый месяц одно и то же: открой ЛК, дождись пока проснётся SPA, ткни в нужную вкладку, закрой баннеры, скачай PDF, повтори по числу объектов и ресурсных организаций. На круг — час кликанья по одинаковым формам.
Спасибо Claude Code — за вечер мы выкатили zhkh. Это парсер, который сам обходит разные ЛК и складывает квитанции в receipts/<месяц>/<сайт>/.
Что под капотом
— Python + Playwright (Chromium headless)
— Креды надежно лежат в `~/.zhkh.keys`
— CLI и tg-bot для удобства
— VLM для извлечения нужных полей квитанций: можно подключить любую модель через openrouter
— На каждой стадии делается скриншот + HTML-дамп в debug/, чтобы при поломке вёрстки сразу видеть, что отвалилось
— В конце прогона табличка с разбивкой по сайтам/объектам/периодам/суммам и общий итог в рублях
Поддерживаемые сайты
— МОЭК
— Мосводоканал
— Мосэнергосбыт
— Эталон
Установка и запуск в один клик
uv run run.py # все сайты
uv run run.py --site moek --headed --debugПодробнее в ридми, тг-бот запускается также просто.
Как улучшить и что дальше?
— Подключение других организаций (МГТС, Интернет, Капремонт).
— Передача показаний счётчиков прямо из бота / CLI
— Оплата квитанций (???)
— Встраивайте в эти ваши уроборосы как скилл 😉
🔗Ссылка: https://github.com/hukenovs/zhkh/
#жкх
4 040
🇨🇳 Xiaomi vs Claude Code
Китайская компания показала новый инструмент для работы с кодом — MiMo Code. По заявлению разработчиков, MiMo Code способен конкурировать с решениями от Anthropic.
Как заявляют авторы, стандартные агенты "плывут" на длинных задачах: ошибки накапливаются, контекст переполняется, опыт не сохраняется, код получается хуже. MiMo решает это системно, не просто "больше токенов", а сложная архитектура под длительные сессии.
Из жирных плюсов: Бесплатно под MIT + замеры на бенчах прилагаются (сравнивали с Sonnet 4.6).
Мы уже немного потестили, из забавного — сносно отвечает на разных языках(см. скриншот), изначально вообще начала говорить на беларусском. 🇧🇾
🔗 Блогпост
🔗 Попробовать
🔗 Гитхаб
#xiaomi #claude #code #news
4 040
Repost from Innovation & Research
📰 На полях Петербургского международного экономического форума открылся пятый сезон выставки «Наука в лицах». Это 32 портрета российских учёных, чьи исследования и разработки отмечены высокими научными наградами. Среди героев экспозиции — лауреаты Научной премии Сбера в номинации «AI в науке» Дмитрий Пензар и Михаил Медведев и победители R&D-премии Сбера 2025 в номинации «Лучший исследователь» Алёна Феногенова и Александр Капитанов.
«Наука — одно из ключевых стратегических направлений для Сбера. Мы создаём собственные исследовательские центры и лаборатории на переднем крае искусственного интеллекта и других областей, работаем с ведущими вузами страны и поддерживаем талантливых учёных. Мы убеждены: именно наука — фундамент технологического суверенитета и будущего всей страны. Поэтому нам так близка идея "Науки в лицах" — проекта, который показывает людей, стоящих за научными открытиями, и рассказывает об их работе широкой аудитории. И нам особенно приятно, что в экспозиции сразу два лауреата Научной премии Сбера и два лауреата нашей внутренней R&D-премии для исследователей — людей, чьи открытия уже сегодня определяют завтрашний день», — отметил старший вице-президент, руководитель блока «Технологическое развитие» ПАО «Сбербанк» Андрей Белевцев.В течение года портреты учёных увидят посетители главных общественных пространств Москвы — ВДНХ, парка «Сокольники», ЦПКиО им. Горького, а также пассажиры столичного метро. Выставка побывает и на площадках федеральных университетов в регионах. А завершится сезон на VI Конгрессе молодых учёных — он пройдёт в Научно-технологическом университете «Сириус» 25–27 ноября 2026 года. Информация о героях проекта – на сайте Десятилетия науки и технологий: наука.рф.
4 040
🚀 One Day Offer RnD ML
Мы проводим One Day Offer, где кандидат может пройти буквально одно техническое собеседование и получить оффер за один день. На этот раз мы ищем AI-исследователей с опытом от 3 лет.
Дата: 6 июня 2026. Участники познакомятся с командой, пройдут технические секции и финальные интервью с лидами.
🔬 Что предстоит делать
— Исследовать и внедрять мультимодальные архитектуры (image, video, text, audio)
— Разбираться с RL-подходами для обучения reasoning-моделей
— Быстро воспроизводить идеи из свежих статей и интегрировать их в командные проекты
— Обучать LLM, VLM, VLA (Robotics) на GPU-кластерах Банка
— Улучшать существующие пайплайны и доводить результаты до PoC / пилотов
🗓️ Как будет выглядеть день
10:00 — презентация команды
10:30 — технические секции
12:00–17:00 — финалы с командой
18:00 — обратная связь
📍 Формат работы: удалёнка по РФ или гибрид в городах присутствия
🎁 Что предлагаем
— Конкурентная компенсация (оклад + премии)
— ДМС с первого дня + страховка от НС и тяжёлых заболеваний
— Социальная поддержка, матпомощь, корпоративная пенсионная программа, пониженная ипотечная ставка
— Дисконты от партнёров, бесплатный фитнес
— Доступ к внешнему и внутреннему обучению, семинарам, конференциям, корпоративной библиотеке
📎 Как участвовать
Подать заявку, пообщаться с рекрутером и получить приглашение.
Регистрируйся! 🤗
#найм #rndml
4 040
🚀 AI Researcher (Middle — Senior+) в R&D NLP, SberAI
Мы — исследовательская команда на переднем крае LLM-технологий. Мейнстрим-рецепт LLM для нас — это потолок, который мы пытаемся пробить.
Ищем архитектурные ходы, новые objective-функции, нестандартные режимы reasoning'а — всё, что может дать кратный прирост качества/скорости. Жизненный цикл идеи: от гипотезы → PoC-фреймворк → прод. флагманской LLM. Если коротко: ищем людей, которым интересна прикладная исследовательская работа в среднем и высоком risk-reward профиле.
🔬 Над чем сейчас работаем
🏗 Альтернативные архитектуры
— encoder-decoder, гибридные attention (linear + softmax), sparse/MoE с нестандартным dispatching, итеративные/loop-трансформеры
🎓 Новые training objectives и режимы обучения
— multi-token и future-state prediction, RL-pretraining, дистилляция против ансамблей teacher-моделей
🧠 Reasoning
— латентный/омнимодальный reasoning, обучаемые value-сети, MCTS-подобный поиск, self-play, ансамбли гетерогенных моделей
⚡️ Эффективность и inference
— адаптивные вычисления, MoD/early-exit, serving для нестандартных архитектур
🎨 Специализированные направления
— символьные/фонетические задачи, креативная генерация, agentic capabilities
Часть гипотез доедет до PoC/прода, часть умрёт на small-scale. Это ожидаемо.
🛠 Чем предстоит заниматься
— Разбирать существующие LLM-пайплайны до компонент и находить места для апгрейда не на 1%, а в разы
— Формулировать research-гипотезы и доводить их от абляций до полного pretrain/post-train цикла со scaling laws
— Обучать, валидировать и имплементировать новые архитектуры и objectives — иногда с залезанием в инфраструктуру (kernel'ы, training-фреймворк, serving)
— Упаковывать результаты в PoC, инференс-движок, пилоты
— Публиковаться на A/A*-конференциях — опционально, но поощряем 📄
✅ Что ждём от кандидатов
— Глубокое понимание современного трансформера и всех этапов LLM-пайплайна
— Качественный воспроизводимый ML-код, опыт обучения в multi-GPU (лучше multi-node) режиме
— Практический опыт на каком-то из этапов LLM-строения — индустрия или серьёзный pet-project, формат не принципиален
— Хорошая насмотренность по литературе, способность читать paper'ы критически — отличать зёрна от плевел
— Умение быстро валидировать смелые гипотезы
➕ Будет плюсом
— опыт в классическом ML/NLP до эпохи больших моделей
— публикации уровня A/A* и опыт прохождения review-цикла
— large-scale training (multi-node, FSDP/DeepSpeed/Megatron)
— призовые места на Kaggle и подобных
🌟 One More Thing
Если вы рок-звезда (уровень техлида и выше) — у нас отдельный трек найма:
💎 compute без бюрократии
💎 запуск нового research-трека под вас
💎 потенциально своя команда и инженерная поддержка под скейлинг
💎 прямое участие в стратегии направления — что делаем, во что не верим, на чём фокусируемся на длинном горизонте
Мы делаем ставку на архитектурные и training-инновации, где количество GPU перестаёт быть единственным фактором.
🔥 Если такая постановка задачи будоражит кровь — пишите.
Куда слать резюме: @VeronikaShel или @dmiryy
Технические вопросы: @walfry или @hukenovs
#найм #hiring #job
4 040
Repost from ODS Events
💚 Data Fest 2026 в Сбере — два города, два дня про AI, data и технологии, которые уже работают в реальной жизни.
📍 Москва — 26 мая
⏰ 10:00–20:00 (регистрация с 9:30)
Офис Сбера на Кутузовском проспекте соберёт инженеров, исследователей, аналитиков и AI-команды, чтобы обсудить:
— GenAI, NextGen AI, GenCV
— агенты и мультиагентные системы
— Mathematics & ML
— Physical AI и роботы
— реальные кейсы, демо и production-решения
В программе — доклады, постерная сессия, демо-зоны, экскурсии по офису и пространство Sber AI Community с воркшопами и активностями комьюнити.
📍 Новосибирск — 28 мая
⏰ 10:00–19:00 (регистрация с 9:30)
Data Fest продолжится в Школе 21 — с фокусом на исследования, практику и живое обсуждение AI-технологий.
В центре внимания:
— генеративные и креативные модели
— качество данных и бенчмарки
— прикладные AI-решения
— R&D и будущее индустрии
В программе — доклады, исследовательские дискуссии и много нетворкинга.
Регистрируйтесь (Москва, Новосибирск) и присоединяетесь 💚
4 040
📣 CFP AIST 2026 – AI / ML / CV / NLP / Social Networks
Приглашаем подать статью на AIST 2026 – 13-ю международную конференцию по анализу изображений, социальных сетей и текстов.
📌 TL;DR
AIST 2026 пройдёт 16–18 октября 2026 в Назарбаев Университете в Астане. Тематики: data science, ML, computer vision, NLP, social network analysis, recsys, data mining и смежные направления.
Что приятно: участие и публикация принятых статей бесплатные. Основные статьи будут опубликованы в Springer LNCS, companion volume – в CCIS.
🗓 Дедлайны
– Abstract: 1 июля 2026
– Full paper: 10 июля 2026
– Notification: 10 августа 2026
– Camera-ready: 18 августа 2026
🔗 Ссылки
Чат: https://t.me/aistconference
CFP: https://aistconf.org/calls/papers/
Submission: https://openreview.net/group?id=aistconf.org/AIST/2026/Conference
Вопросы: org@aistconf.org или в чате конференции.
Будем рады увидеться на AIST 2026 в Астане 🇰🇿
4 040
🎨 GigaChat + Kandinsky 6.0 Image Pro
Редактирование изображений вышло на новый уровень! Обновили функцию редактирования картинок в GigaChat — теперь под капотом работает Kandinsky 6.0 Image Pro 🚀
⚡️ Что улучшилось
• Скорость генерации выросла до ×2
• Модель лучше понимает сложные и многосоставные запросы
• Результат — более детализированный и качественный
📸 Нейрофотосессии в одном промпте
Kandinsky 6.0 позволяет полноценно трансформировать изображения:
→ менять локации, одежду, макияж
→ стилизовать под любые визуальные тренды
→ восстанавливать и улучшать старые архивные снимки
🧠 Точность и контроль
• Правки вносятся аккуратнее, модель лучше держит контекст
• Снижено количество «галлюцинаций»
• Улучшена работа с текстом на изображениях
🕸 Image RAG в деле
Благодаря встроенному поиску по изображениям, Kandinsky 6.0 лучше ориентируется в актуальных темах и референсах.
🧪 Личный тест
Попробовал изменить любимого котика:
[Сделай котика с рыжими полосами как у тигра и замени фон на пальмы и море]
🔗 Обновление доступно на всех платформах, но удобнее всего редактировать в вебе: Kandinsky 6 Image. Детали в статье на Хабр.
#gigachat #kandinsky #release
4 040
🚀 Middle / Senior AI Engineer: Native Omnimodality, Reasoning & Robotics (RnD ML)
Ищем инженеров-исследователей для двух стримов нашей команды:
🔹 Native Omnimodality & VLA
🔹 Omnimodal Reasoning & Tool-Call
Никаких API-костылей и заморозки весов. Только фундаментальная архитектура, joint pretraining и работа на стыке AI, видео, аудио и робототехники.
Задачи
🧠 Проектировать и имплементировать принципиально новые мультимодальные архитектуры (vision, audio, video, text) в едином латентном пространстве
🔮 Разрабатывать universal encoders и shared latent spaces, контрастивные и joint-эмбеддинги
🤖 Создавать VLA (Vision-Language-Action) пайплайны и стримы взаимодействия с роботами
📈 Исследовать RL-подходы для обучения reasoning-моделей с активным tool-calling
🎬 Обучать модели на длинных видео (>1 часа) и масштабных мультимодальных датасетах
🔬 Быстро разбирать идеи из статей и воспроизводить их
Что ожидаем
• Уверенный Python 3, PyTorch, bash, git, Docker
• Глубокое понимание representation learning и multimodal learning
• Опыт работы с мультимодальными LLM/VLM «под капотом» (не API-обёртки)
• Понимание архитектуры трансформеров, contrastive learning, joint embeddings
• Знание особенностей alignment современных LLM и reasoning-паттернов
• Умение читать, декомпозировать и воспроизводить research-статьи
➕ Будет сильным плюсом
• Опыт распределённого обучения
• Реальный опыт pretraining мультимодальных моделей с нуля
• Работа с video/audio модальностями, streaming data pipelines
• Бэкграунд в VLA / embodied AI / robotics
• Публикации, open-source вклад или академический или исследовательский опыт
💸 Почему у нас интересно
🔥 Честный RnD: мы не инициализируем претрейны весами Qwen, а учим с нуля
🌍 Влияние на архитектуры следующего поколения, а не на 10-й слой файнтюна
📚 Поддержка публикаций, поездок на конференции и open-source инициатив
🤝 Команда сильных исследователей + доступ к серьёзным вычислительным ресурсам
🚀 Чёткий путь: идея → исследование → эксперименты → деплой
Контакты для резюме: @VeronikaShel @dmiryy
Если у вас остались вопросы по вакансиям — @nagadit
#hiring #job
4 040
🚀 xAI сдает свои GPU в аренду
https://www.businessinsider.com/elon-musk-xai-compute-cursor-ai-model-training-2026-4
📌 TL;DR
Громкий заголовок, за которым кроется главная проблема xAI: утилизация GPU крайне низкая — всего 11% (!!!)
Илон Маск решил монетизировать свою гигантскую GPU-инфраструктуру: xAI планирует сдавать вычислительные мощности Cursor, который развивает популярного AI-кодинг-ассистента. Cursor будет использовать десятки тысяч GPU xAI (в рамках проекта Colossus) для обучения своей новой модели Composer 2.5.
Фактически xAI превращается в облачного провайдера, вступая в прямую конкуренцию с AWS, Microsoft Azure, Google Cloud и т.д. Это не просто способ заработать, а попытка поднять MFU (Model FLOPs Utilization) — который в xAI сейчас всего 11% против 35-45% у конкурентов.
🤔 Зачем это xAI?
1. Огромные мощности и низкая эффективность
У xAI уже есть около 200 000 GPU Nvidia, а планы — до 1 миллиона. Но эффективность использования (MFU) составляет всего ~11%. Президент xAI назвал это "embarrassingly low" и поставил цель достичь 50% в ближайшие месяцы. Сдача мощностей в аренду — классический способ «догрузить» простои и подтянуть эффективность.
2. Доступ к данным
Cursor — это не просто кодер, это платформа, через которую тысячи разработчиков генерируют код. У Cursor есть доступ к уникальным данным о том, как люди реально пишут, правят и рефакторят код. Для xAI, которая тоже делает свои модели, это золотая жила.
⁉️А насколько эффективно ваши пайплайны загружают GPU-кластеры?
#economy #gpu #xAI #cursor
4 040
+2
🤖 AI in KZ 🇰🇿
Несколько дней назад посетили Казахстан 🇰🇿 с @oulenspiegel_channel , где прочитали лекции о развитии искусственного интеллекта: поговорили про прошлое, настоящее и будущее ИИ, и что нас ждёт в ближайшей перспективе. Получился не просто формат лекций, а очень насыщенный диалог с коллегами из разных министерств, спасибо за теплый приём!
🧠 О чем говорили?
🔹 Начал выступление @oulenspiegel с лекцией про следующее поколение нейросетевых моделей и каким будет мир после LLM. Часть материалов вы можете найти у Сергея в канале 👉 https://t.me/oulenspiegel_channel/5082
🔹 Затем дискуссию продолжил @hukenovs с техническим докладом об эволюции нейросетевых решений. В частности о том, какие революционные вызовы случались в области ИИ за последние 30 лет, где мы находимся прямо сейчас и что нас ждет в самом ближайшем будущем с практической точки зрения.
🔹 И завершил сессию @evgenijkkk с насыщенным и глубоким техническим докладом о последних успехах в развитии флагманской российском модели GigaChat, рассказав подробно о всех нюансах обучения моделей такого класса. Подробнее можно почитать на хабре.
📌 Немного фактов
Министерство искусственного интеллекта и цифрового развития Республики Казахстан образовалось в сентябре 2025 года на базе нескольких министерств и является ключевым государственным органом, ответственным за технологическую трансформацию страны. Основные задачи:
— Развитие экосистемы ИИ: Создание правовых, технических и образовательных условий для внедрения технологий ИИ в экономику и гос. управление.
— Реализация стратегии "Цифровой Казахстан": Ускорение экономического роста и повышение качества жизни населения за счет цифровизации.
— Создание суверенного ИИ: Разработка национальной языковой модели, развитие национальной инфраструктуры данных и вычислительных мощностей.
— Регулирование и безопасность: Реализация Закона «Об искусственном интеллекте», обеспечение безопасности данных, прозрачности алгоритмов и ответственности при использовании ИИ.
— Цифровизация отраслей: Внедрение ИИ в банковский сектор, IT-сферу, телекоммуникации, горнодобывающую промышленность, фармацевтику и ритейл.
— Развитие человеческого капитала: Подготовка кадров в сфере IT и ИИ, развитие инновационной экосистемы.
#ai #gigachat #kazakhstan
4 040
Repost from Data Engineer Jobs
🔥 Присоединяйся к дата-инженерной команде Управления экспериментальных систем машинного обучения SberAI — собираем данные для прорывных GenAI-моделей
Привет! 👋 Мы — дата-инженерная команда внутри Управления экспериментальных систем машинного обучения SberAI. Наша миссия — поставлять качественные мультимодальные датасеты в продуктовые команды, которые развивают генеративные модели: speech, music, image, video, 3D, text.
Чем будешь заниматься на самом деле:
🔍 Парсить открытые источники: YouTube, Telegram, Pinterest, HuggingFace, VK.
🧪 Генерировать синтетические данные через SOTA-модели (Qwen, Flux, Gemini и др.) — ты сам создаешь «топливо» для обучения.
⚙️ Оркестрировать ETL/ELT-пайплайны, фильтровать дубли, блюр, водяные знаки, нелегальный контент, оценивать реалистичность и эстетику.
👥 Организовывать проекты ручного сбора и валидации на крауд-платформах TagMe, Elementary, ЯЗ.
Наш стек: 🛠
Python • SQL • S3 • Hadoop/GreenPlum • Airflow • Docker/K8s • Git • Vault • ML Space • Confluence • Jira
Что нужно, чтобы стать своим:
✅ Знание Python (библиотеки для работы с данными и API)
✅ Опыт с ML-пайплайнами и датасетами для CV/NLP
✅ Понимание ETL/ELT и жизненного цикла данных
✅ SQL: SELECT, JOIN, агрегаты, подзапросы
✅ Базовое понимание форматов: CSV, JSON, Parquet, сериализация
✅ Опыт с Docker/Kubernetes
Будет плюсом: 🌟
Airflow или другие оркестраторы
Понимание облачных сервисов
Почему тебе здесь понравится:
📍 Офис и формат: современный офис рядом с м. Кутузовская + гибридный график. Хочешь из дома — ок, хочешь в офис с корпоративным спортзалом и зонами отдыха — пожалуйста.
💰 Деньги и стабильность: ежегодный пересмотр зарплаты + годовая премия.
🏠 Ипотека для сотрудников — реальная возможность решить жилищный вопрос.
🩺 Забота о здоровье: расширенный ДМС с первого дня работы + страхование для семьи.
🎁 Бонусы: бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров, вознаграждение за рекомендацию друзей в команду Сбера.
📚 Рост: система обучения для профессионального и карьерного развития.
Как попасть в команду? 🚀
Откликайся по ссылке: https://hh.ru/vacancy/132344139
https://t.me/rndml_team
4 040
Repost from (sci)Berloga Всех Наук и Технологий
🚀 Серия соревнований по МЛ и научный проект ! Денежный призовой фонд больше 150 000 р и будет расти ! Кому интересен МЛ/RL или математика или пазлы или роботы.
Приглашаем Вас принять участие в серии челленджей и развитии научного опен-соурс проекта.
Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении д.ф.-м.н. А. Арутюнова: https://t.me/forodirchNEWS/3165 , или хабре или чате @starkitmega.
Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл.
Первый Второй разыгрываемый приз - 10 000 рублей.
Условия первого второго этапа очень простые.
Есть три челленджа на Каггле
Мегаминкс
https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard
Кубик Рубика 333
https://www.kaggle.com/competitions/cayleypy-ihes-cube
Кубик Рубика 444
https://www.kaggle.com/competitions/cayley-py-444-cube
Приз будет получен первым, кто достигнет ЛЮБУЮ из целей:
1 Или в конкурсе Мегаминкс - кто достигает скор 75 000 (вы получите 5 000 рублей, 70 000 ещё 5 000 рублей) и опубликует публичное решение. (Первая цель 80 000 уже достигнута. Приз уйдёт Владу Кузнецову, МФТИ).
2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов).
Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogacompete @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве).
Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи.
Планируется серия челленджей и призов. Первый приз уже разыгран, второй объявлен, скоро будут новые объявления -- оставайтесь с нами !
================
А также мы ищем Cпоносоров.
Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505
Или напишите @alexander_v_c (Александр Червов)
И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите:
https://github.com/cayleypy/cayleypy
================
Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store
================
Выражаем благодарность агентству BLASTIM за поддержку:
❤️ Наши курсы: agency.blastim.ru
🥨 Свежие вакансии в биотехе: blastim.ru
🤝 https://t.me/blastim
4 040
🤖 GenAI на AiConf
Приходите 20 апреля на AiConf 2026 послушать крутые доклады и мастерклассы, поиграть в Sber AI Simulator, а также посетите нашу GenAI-зону, где вы сможете пообщаться с нашим иммерсивным аватаром Ирочкой 🤗 . В Пространстве GenAI вас ждут углублённые мастер‑классы по генеративному ИИ — с реальными кейсами, инструментами и поддержкой экспертов.
Напомним, что мы активно нанимаем как отдельных сильных кандидатов, так и целые команды AI-энтузиастов. На конференции вы сможете позадавать вопросы о наших технических и продуктовых стримах, а в случае успеха — пройти максимально упрощенный путь найма в RnD-департамент! Приходите, будет интересно! 😇
#conference #aiconf #hire
4 040
🚀 KVAE-2.0 is here!
Несколько месяцев назад наши коллеги из Kandinsky Lab выпустили токенизаторы для видео и изображений — KVAE-1.0. А сегодня представляют следующее поколение: KVAE-2.0 — две новые модели, которые превосходят Wan 2.2 и HunyuanVideo 1.5 по объективным метрикам реконструкции и семантике генерации, по метрикам визуального качества генерации находятся в паритете с ними.
Форматы:
▫️4x8x8 (апгрейд KVAE-1.0: 8x ширина/высота, 4x кадры).
▫️4x16x16 (более агрессивное сжатие).
В разработке KVAE-2.0 особое внимание уделили diffusability — свойству латентного пространства, насколько оно подходит для диффузионных моделей.
Коллеги рассмотрели актуальные тренды в токенизации видео, описали архитектурные изменения в KVAE-2.0 (включая сложности создания такого токенизатора). Все это подробно описано в статье на Хабр.
🔗 Модель t4s8 / Модель t4s16
🔗 Код на GitHub
#kandinsky #release
4 040
♿ HearMe: Патент на AI-переводчик жестового языка от Abu Dhabi University
https://www.wam.ae/en/article/bzm36g2-abu-dhabi-university-granted-patent-for-ai-powered
📌 TL;DR
Abu Dhabi University (ADU) получил патент на HearMe — AI-приложение для двунаправленного перевода между жестовым языком и текстом в реальном времени. Поддерживает мультиязычность (американский, французский жестовый язык), работает в образовательных и профессиональных сценариях. Проект встраивается в национальную стратегию ОАЭ по поддержке People of Determination. Разработчики: Dr. Modafar Ati + выпускница Reem Al Bostami.
HearMe — один из редких примеров, когда исследовательская разработка дошла до патента и ориентирована на мультиязычную реальность. В ОАЭ живут люди со знанием различных жестовых языков, и единого "арабского жестового" не существует. HearMe позволяет говорить на американском и французском жестовом языке внутри одной системы — это нетривиальная задача, которую авторы, судя по всему, решили через промежуточное семантическое представление (скорее всего, без привязки к конкретному языку жестов).
🧠 Зачем?
Глобально около 430 млн. людей имеют нарушения слуха, но большинство инструментов коммуникации либо односторонние (текст → жест), либо ограничены одним языком жестов. В академической и рабочей среде это создаёт барьеры коммуникации. Авторы патента задают вопрос: можно ли создать масштабируемое решение, которое одновременно (1) работает в реальном времени, (2) поддерживает несколько жестовых языков и (3) интегрируется в существующие образовательные/корпоративные платформы?
⚙️ Интеграция
— Классы / лекции: субтитрование + аватар для глухих студентов
— Корпоративное обучение: доступ к материалам без человеческого переводчика
— Публичные сервисы: демо-стенды, приложения с поддержкой жестового ввода
🌍 Мультиязычность
Большинство современных моделей перевода обучаются под один язык жестов. HearMe заявляет поддержку нескольких систем (ASL, FSL и, вероятно, других). Как это достигается?
— Либо через общее embedding-пространство (ImageBind-like подход: жесты → семантика → текст на любом языке),
— либо через отдельные декодеры для каждого языка жестов при общем визуальном энкодере.
Первый путь — более элегантный и масштабируемый, но сложный в обучении без больших параллельных данных. Второй — проще, но быстро раздувает модель. Какой выбрали авторы — остаётся загадкой до публикации патента или статьи.
🔗 Источник: WAM (Emirates News Agency), April 2026 | Abu Dhabi University
#signlanguage
4 040
💸💸 Найм! 💸💸
Устал инициализировать претрейны весами Qwen? Приходи к нам, мы честно учим с нуля!
Ищем Senior/Senior+ AI Engineer, а также продактов в RnD-команду! А если у вас есть небольшая команда и вы хотите прийти к нам полным составом — пишите, рассмотрим!
👥 О нас:
Мы — управление экспериментальных систем машинного обучения (УЭСМО или RnD ML), разрабатываем прорывные AI-решения.
🤖 Native Omnimodality & VLA
Создание нативных омнимодальных архитектур, новых способов кодирования и совместного обучения в доменах изображений, аудио, видео и т.д. Разработка принципиально новых представлений и кодирования информации, а также стрим VLA взаимодействия с роботами 🤖
🚀 LLM "bleeding edge" R&D
Эксперименты с архитектурами LLM, оркестрация моделей, разработка прототипов агентных фреймворков и перспективных подходов к обучению, исследования по всему фронтиру современного LLM-строения.
🎙️ Native Speech & Audio Editing
Разработка омнимодальной Full-Duplex архитектуры, которая слышит, говорит, нативно понимает перебивания и одновременно работает с речью, текстом и визуальной информацией. Проектирование архитектуры инструктивного редактирования в домене аудио. 🎼✨
🧠 Omnimodal reasoning
Задачи имплементации нативного латентного и омнимодального ризонинга в LLM и VLM. Мультимодальный reasoning и синхронизация потоков разных модальностей (audio–text–vision), включая стримы UI и VLA.
💻 Computer Operator
Задачи управления компьютерами, телефонами, браузерами и т.п. Мы прицельно улучшаем работу моделей в этих задачах, используя передовые методы обучения (такие как online RL в средах).
🔎 Benchmarking
Занимается передовыми исследованиями в области LLM и мультимодальных моделей, AI-агентов и LM-as-Judge. Создаем новые подходы к оценке, обучаем генеративные модели и исследуем их способности. Результаты представляем на ведущих конференциях высшего уровня А/А*, а также применяем в продуктах.
👩💻 Product Manager
Ищем PM в команду, которая работает на переднем крае технологий. Никакой поддержки легаси — только R&D, early stage и high uncertainty. Здесь не работает подход «собрал требования — передал в разработку». Мы превращаем свежие исследования в MVP, структурируем хаос и проверяем гипотезы в условиях, когда готового решения нет.
🛠 Data Engineering
Ищем дата-инженеров, которые будут выстраивать сложные мультимодальные пайплайны сбора, разметки, валидации данных для обучения моделей во всех перечисленных выше ML-стримах.
📩 В сообщении укажите, на какую позицию откликаетесь!
Контакты для резюме: @VeronikaShel @dmiryy
Если у вас остались вопросы по вакансиям —
Технический стрим: @hukenovs
Продуктовый стрим: @Valentina_Khlebutina
#job #hiring
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
