RnD ML Team

前往频道在 Telegram

RnD ML @ Sber-AI Admin: @hukenovs Repos: https://github.com/ai-forever/

显示更多

俄罗斯132 779 技术与应用21 396

4 016

订阅者

-724 小时

-277 天

-2530 天

2 599

帖子浏览量

~ 1 02024 小时

~ 1 08448 小时

64.70%

参与率

无数据

每日帖子数

Ads index

beta

帖子存档

4 016

🌿 Адаптация мема на нашу индустрию. После физики видим небольшой провал, а потом в вашу жизнь врывается этот эйай. Но график уже не остановить...

4 016

🛣 Нерешенные задачи для LLM Или вечерний ресерч и как LLM не справились с несложной задачей составления маршрута. 💡 Идея Захотелось как-то проехать по маршруту МКАД → ТТК → Садовое, то есть сделать три полных кольца. Зачем? Красивый GPS-трек в активностях часов. На картах тыкать 30-50+ точек было лень (если меньше, то навигатор предлагает маршрут "оптимальнее", но режет круги). Поэтому было решено отдать задачу этим вашим нейросетям. 🗯 Подробное условие

Сделай закольцованный маршрут МКАД → ТТК → Садовое. То есть нужно сделать полный круг по МКАД, потом сделать сделать съезд на ТТК и полный круг по ТТК, затем полный круг по Садовому. Точку старта возьми в любом удобном месте на МКАД (например: на Можайском шоссе). Финиш в любом месте после полного последнего круга садового кольца. Поставь столько точек, сколько нужно, чтобы маршрут закольцевался, а не искал оптимальный или короткий путь. Маршрут сделай ссылкой на Яндекс Картах.

Что получилось? — Deepseek плохо: думал-думал, ссылку так нормально и не хотел выдавать. Пришлось мучать дольше всех. Итого прислал ссылку на 30+ рандомных точек, большая часть которых вообще не на дороге. — Qwen плохо: пришлось постоянно доуточнять условия, но что-то прислал (вообще и близко не похожее, но хотя бы в Москве). — ChatGPT получше: отказался делать ссылку в Я.Картах и требовал GPX-трек, ну ОК. Результат очень грубый, хоть и видно три кольца. — Gemini ужасно: решил, что 10 точек достаточно, в итоге получились полукруги на всех кольцах. ИМХО, хуже всех справился, да еще и за деньги. — Claude на версии Fable, конечно, не удалось на этой задаче потестить, но Opus был ближе всех. Хоть и неправильно местами, но он хотя бы предложил разбить на три колечка и сразу сказал, что у Яндекса могут быть проблемы с отображением в вебе >10 точек. А ещё он предложил сделать ссылки на 2ГИС и Гуглмапы. 2ГИС получилась битая, а гуглмапа относительно похожа на правду. Российские аналоги протестируйте сами) Бенчмарк? Можно ли из этого сделать бенчмарк планирования сложных маршрутов? Однозначно — да. Что-то похожее есть, но прямо на составление многосоставных сложных маршрутов сходу не нашлось. Ниже список актуальных бенчей на эту тему беглым поиском: MobilityBench (2026) — масштабируемый бенчмарк для оценки LLM-агентов в реальных задачах планирования маршрутов CityBench (2024) — первый комплексный бенчмарк для оценки способности LLM выступать в роли городской модели мира TransitLM (2026) — масштабный датасет и бенчмарк для обучения моделей генерации маршрутов общественного транспорта без использования карт GridRoute (2025) — бенчмарк для оценки LLM в задачах поиска пути на дискретной сетке карты #карты #деньги #трикольца

4 016

🛣 Нерешенные задачи для LLM Или вечерний ресерч и как AI-сервисы не справились с несложной задачей составления маршрута. 💡 Идея Захотелось как-то проехать по маршруту МКАД → ТТК → Садовое, то есть сделать три полных кольца. Зачем? Красивый GPS-трек в активностях часов. На картах тыкать 30-50+ точек было лень (если меньше, то навигатор предлагает маршрут "оптимальнее", но режет круги). Поэтому было решено отдать задачу этим вашим нейросетям. 🗯 Подробное условие

Сделай закольцованный маршрут МКАД → ТТК → Садовое. То есть нужно сделать полный круг по МКАД, потом сделать сделать съезд на ТТК и полный круг по ТТК, затем полный круг по Садовому. Точку старта возьми в любом удобном месте на МКАД (например: на Можайском шоссе). Финиш в любом месте после полного последнего круга садового кольца. Поставь столько точек, сколько нужно, чтобы маршрут закольцевался, а не искал оптимальный или короткий путь. Маршрут сделай ссылкой на Яндекс Картах.

Что получилось? — Deepseek плохо: думал-думал, ссылку так нормально и не хотел выдавать. Пришлось мучать дольше всех. Итого прислал ссылку на 30+ рандомных точек, большая часть которых вообще не на дороге. — Qwen плохо: пришлось постоянно доуточнять условия, но что-то прислал (вообще и близко не похожее, но хотя бы в Москве). — ChatGPT получше: отказался делать ссылку в Я.Картах и требовал GPX-трек, ну ОК. Результат очень грубый, хоть и видно три кольца. — Gemini ужасно: решил, что 10 точек достаточно, в итоге получились полукруги на всех кольцах. ИМХО, хуже всех справился, да еще и за деньги. — Claude на версии Fable, конечно, не удалось потестить, но Opus был ближе всех. Хоть и неправильно местами, но он хотя бы предложил разбить на три колечка и сразу сказал, что у Яндекса могут быть проблемы с отображением в вебе >10 точек. А ещё он предложил сделать ссылки на 2ГИС и Гуглмапы. 2ГИС получилась битая, а гуглмапа относительно похожа на правду. Российские аналоги протестируйте сами😮‍💨 Бенчмарк? Можно ли из этого сделать бенчмарк планирования сложных маршрутов? Однозначно — да. Что-то похожее есть, но прямо на составление многосоставных сложных маршрутов сходу не нашлось. Ниже список актуальных бенчей на эту тему беглым поиском: MobilityBench (2026) — масштабируемый бенчмарк для оценки LLM-агентов в реальных задачах планирования маршрутов CityBench (2024) — первый комплексный бенчмарк для оценки способности LLM выступать в роли городской модели мира TransitLM (2026) — масштабный датасет и бенчмарк для обучения моделей генерации маршрутов общественного транспорта без использования карт GridRoute (2025) — бенчмарк для оценки LLM в задачах поиска пути на дискретной сетке карты #карты #деньги #трикольца

4 016

🏠 ЖКХ вы че творите?? Админ устал собирать квитанции и передавать показания. Каждый месяц одно и то же: открой ЛК, дождись пока проснётся SPA, ткни в нужную вкладку, закрой баннеры, скачай PDF, повтори по числу объектов и ресурсных организаций. На круг — час кликанья по одинаковым формам. Спасибо Claude Code — за вечер мы выкатили zhkh. Это парсер, который сам обходит разные ЛК и складывает квитанции в receipts/<месяц>/<сайт>/. Что под капотом — Python + Playwright (Chromium headless) — Креды надежно лежат в `~/.zhkh.keys` — CLI и tg-bot для удобства — VLM для извлечения нужных полей квитанций: можно подключить любую модель через openrouter — На каждой стадии делается скриншот + HTML-дамп в debug/, чтобы при поломке вёрстки сразу видеть, что отвалилось — В конце прогона табличка с разбивкой по сайтам/объектам/периодам/суммам и общий итог в рублях Поддерживаемые сайты — МОЭК — Мосводоканал — Мосэнергосбыт — Эталон Установка и запуск в один клик uv run run.py # все сайты uv run run.py --site moek --headed --debugПодробнее в ридми, тг-бот запускается также просто. Как улучшить и что дальше? — Подключение других организаций (МГТС, Интернет, Капремонт). — Передача показаний счётчиков прямо из бота / CLI — Оплата квитанций (???) — Встраивайте в эти ваши уроборосы как скилл 😉 🔗Ссылка: https://github.com/hukenovs/zhkh/ #жкх

4 016

🇨🇳 Xiaomi vs Claude Code Китайская компания показала новый инструмент для работы с кодом — MiMo Code. По заявлению разработчиков, MiMo Code способен конкурировать с решениями от Anthropic. Как заявляют авторы, стандартные агенты "плывут" на длинных задачах: ошибки накапливаются, контекст переполняется, опыт не сохраняется, код получается хуже. MiMo решает это системно, не просто "больше токенов", а сложная архитектура под длительные сессии. Из жирных плюсов: Бесплатно под MIT + замеры на бенчах прилагаются (сравнивали с Sonnet 4.6). Мы уже немного потестили, из забавного — сносно отвечает на разных языках(см. скриншот), изначально вообще начала говорить на беларусском. 🇧🇾 🔗 Блогпост 🔗 Попробовать 🔗 Гитхаб #xiaomi #claude #code #news

4 016

Repost from Innovation & Research

📰 На полях Петербургского международного экономического форума открылся пятый сезон выставки «Наука в лицах». Это 32 портрета российских учёных, чьи исследования и разработки отмечены высокими научными наградами. Среди героев экспозиции — лауреаты Научной премии Сбера в номинации «AI в науке» Дмитрий Пензар и Михаил Медведев и победители R&D-премии Сбера 2025 в номинации «Лучший исследователь» Алёна Феногенова и Александр Капитанов.

«Наука — одно из ключевых стратегических направлений для Сбера. Мы создаём собственные исследовательские центры и лаборатории на переднем крае искусственного интеллекта и других областей, работаем с ведущими вузами страны и поддерживаем талантливых учёных. Мы убеждены: именно наука — фундамент технологического суверенитета и будущего всей страны. Поэтому нам так близка идея "Науки в лицах" — проекта, который показывает людей, стоящих за научными открытиями, и рассказывает об их работе широкой аудитории. И нам особенно приятно, что в экспозиции сразу два лауреата Научной премии Сбера и два лауреата нашей внутренней R&D-премии для исследователей — людей, чьи открытия уже сегодня определяют завтрашний день», — отметил старший вице-президент, руководитель блока «Технологическое развитие» ПАО «Сбербанк» Андрей Белевцев.

В течение года портреты учёных увидят посетители главных общественных пространств Москвы — ВДНХ, парка «Сокольники», ЦПКиО им. Горького, а также пассажиры столичного метро. Выставка побывает и на площадках федеральных университетов в регионах. А завершится сезон на VI Конгрессе молодых учёных — он пройдёт в Научно-технологическом университете «Сириус» 25–27 ноября 2026 года. Информация о героях проекта – на сайте Десятилетия науки и технологий: наука.рф.

4 016

🚀 One Day Offer RnD ML Мы проводим One Day Offer, где кандидат может пройти буквально одно техническое собеседование и получить оффер за один день. На этот раз мы ищем AI-исследователей с опытом от 3 лет. Дата: 6 июня 2026. Участники познакомятся с командой, пройдут технические секции и финальные интервью с лидами. 🔬 Что предстоит делать — Исследовать и внедрять мультимодальные архитектуры (image, video, text, audio) — Разбираться с RL-подходами для обучения reasoning-моделей — Быстро воспроизводить идеи из свежих статей и интегрировать их в командные проекты — Обучать LLM, VLM, VLA (Robotics) на GPU-кластерах Банка — Улучшать существующие пайплайны и доводить результаты до PoC / пилотов 🗓️ Как будет выглядеть день 10:00 — презентация команды 10:30 — технические секции 12:00–17:00 — финалы с командой 18:00 — обратная связь 📍 Формат работы: удалёнка по РФ или гибрид в городах присутствия 🎁 Что предлагаем — Конкурентная компенсация (оклад + премии) — ДМС с первого дня + страховка от НС и тяжёлых заболеваний — Социальная поддержка, матпомощь, корпоративная пенсионная программа, пониженная ипотечная ставка — Дисконты от партнёров, бесплатный фитнес — Доступ к внешнему и внутреннему обучению, семинарам, конференциям, корпоративной библиотеке 📎 Как участвовать Подать заявку, пообщаться с рекрутером и получить приглашение. Регистрируйся! 🤗 #найм #rndml

4 016

🚀 AI Researcher (Middle — Senior+) в R&D NLP, SberAI Мы — исследовательская команда на переднем крае LLM-технологий. Мейнстрим-рецепт LLM для нас — это потолок, который мы пытаемся пробить. Ищем архитектурные ходы, новые objective-функции, нестандартные режимы reasoning'а — всё, что может дать кратный прирост качества/скорости. Жизненный цикл идеи: от гипотезы → PoC-фреймворк → прод. флагманской LLM. Если коротко: ищем людей, которым интересна прикладная исследовательская работа в среднем и высоком risk-reward профиле. 🔬 Над чем сейчас работаем 🏗 Альтернативные архитектуры — encoder-decoder, гибридные attention (linear + softmax), sparse/MoE с нестандартным dispatching, итеративные/loop-трансформеры 🎓 Новые training objectives и режимы обучения — multi-token и future-state prediction, RL-pretraining, дистилляция против ансамблей teacher-моделей 🧠 Reasoning — латентный/омнимодальный reasoning, обучаемые value-сети, MCTS-подобный поиск, self-play, ансамбли гетерогенных моделей ⚡️ Эффективность и inference — адаптивные вычисления, MoD/early-exit, serving для нестандартных архитектур 🎨 Специализированные направления — символьные/фонетические задачи, креативная генерация, agentic capabilities Часть гипотез доедет до PoC/прода, часть умрёт на small-scale. Это ожидаемо. 🛠 Чем предстоит заниматься — Разбирать существующие LLM-пайплайны до компонент и находить места для апгрейда не на 1%, а в разы — Формулировать research-гипотезы и доводить их от абляций до полного pretrain/post-train цикла со scaling laws — Обучать, валидировать и имплементировать новые архитектуры и objectives — иногда с залезанием в инфраструктуру (kernel'ы, training-фреймворк, serving) — Упаковывать результаты в PoC, инференс-движок, пилоты — Публиковаться на A/A*-конференциях — опционально, но поощряем 📄 ✅ Что ждём от кандидатов — Глубокое понимание современного трансформера и всех этапов LLM-пайплайна — Качественный воспроизводимый ML-код, опыт обучения в multi-GPU (лучше multi-node) режиме — Практический опыт на каком-то из этапов LLM-строения — индустрия или серьёзный pet-project, формат не принципиален — Хорошая насмотренность по литературе, способность читать paper'ы критически — отличать зёрна от плевел — Умение быстро валидировать смелые гипотезы ➕ Будет плюсом — опыт в классическом ML/NLP до эпохи больших моделей — публикации уровня A/A* и опыт прохождения review-цикла — large-scale training (multi-node, FSDP/DeepSpeed/Megatron) — призовые места на Kaggle и подобных 🌟 One More Thing Если вы рок-звезда (уровень техлида и выше) — у нас отдельный трек найма: 💎 compute без бюрократии 💎 запуск нового research-трека под вас 💎 потенциально своя команда и инженерная поддержка под скейлинг 💎 прямое участие в стратегии направления — что делаем, во что не верим, на чём фокусируемся на длинном горизонте Мы делаем ставку на архитектурные и training-инновации, где количество GPU перестаёт быть единственным фактором. 🔥 Если такая постановка задачи будоражит кровь — пишите. Куда слать резюме: @VeronikaShel или @dmiryy Технические вопросы: @walfry или @hukenovs #найм #hiring #job

4 016

Repost from ODS Events

💚 Data Fest 2026 в Сбере — два города, два дня про AI, data и технологии, которые уже работают в реальной жизни. 📍 Москва — 26 мая ⏰ 10:00–20:00 (регистрация с 9:30) Офис Сбера на Кутузовском проспекте соберёт инженеров, исследователей, аналитиков и AI-команды, чтобы обсудить: — GenAI, NextGen AI, GenCV — агенты и мультиагентные системы — Mathematics & ML — Physical AI и роботы — реальные кейсы, демо и production-решения В программе — доклады, постерная сессия, демо-зоны, экскурсии по офису и пространство Sber AI Community с воркшопами и активностями комьюнити. 📍 Новосибирск — 28 мая ⏰ 10:00–19:00 (регистрация с 9:30) Data Fest продолжится в Школе 21 — с фокусом на исследования, практику и живое обсуждение AI-технологий. В центре внимания: — генеративные и креативные модели — качество данных и бенчмарки — прикладные AI-решения — R&D и будущее индустрии В программе — доклады, исследовательские дискуссии и много нетворкинга. Регистрируйтесь (Москва, Новосибирск) и присоединяетесь 💚

4 016

📣 CFP AIST 2026 – AI / ML / CV / NLP / Social Networks Приглашаем подать статью на AIST 2026 – 13-ю международную конференцию по анализу изображений, социальных сетей и текстов. 📌 TL;DR AIST 2026 пройдёт 16–18 октября 2026 в Назарбаев Университете в Астане. Тематики: data science, ML, computer vision, NLP, social network analysis, recsys, data mining и смежные направления. Что приятно: участие и публикация принятых статей бесплатные. Основные статьи будут опубликованы в Springer LNCS, companion volume – в CCIS. 🗓 Дедлайны – Abstract: 1 июля 2026 – Full paper: 10 июля 2026 – Notification: 10 августа 2026 – Camera-ready: 18 августа 2026 🔗 Ссылки Чат: https://t.me/aistconference CFP: https://aistconf.org/calls/papers/ Submission: https://openreview.net/group?id=aistconf.org/AIST/2026/Conference Вопросы: org@aistconf.org или в чате конференции. Будем рады увидеться на AIST 2026 в Астане 🇰🇿

4 016

🎨 GigaChat + Kandinsky 6.0 Image Pro Редактирование изображений вышло на новый уровень! Обновили функцию редактирования картинок в GigaChat — теперь под капотом работает Kandinsky 6.0 Image Pro 🚀 ⚡️ Что улучшилось • Скорость генерации выросла до ×2 • Модель лучше понимает сложные и многосоставные запросы • Результат — более детализированный и качественный 📸 Нейрофотосессии в одном промпте Kandinsky 6.0 позволяет полноценно трансформировать изображения: → менять локации, одежду, макияж → стилизовать под любые визуальные тренды → восстанавливать и улучшать старые архивные снимки 🧠 Точность и контроль • Правки вносятся аккуратнее, модель лучше держит контекст • Снижено количество «галлюцинаций» • Улучшена работа с текстом на изображениях 🕸 Image RAG в деле Благодаря встроенному поиску по изображениям, Kandinsky 6.0 лучше ориентируется в актуальных темах и референсах. 🧪 Личный тест Попробовал изменить любимого котика: [Сделай котика с рыжими полосами как у тигра и замени фон на пальмы и море] 🔗 Обновление доступно на всех платформах, но удобнее всего редактировать в вебе: Kandinsky 6 Image. Детали в статье на Хабр. #gigachat #kandinsky #release

4 016

🚀 Middle / Senior AI Engineer: Native Omnimodality, Reasoning & Robotics (RnD ML) Ищем инженеров-исследователей для двух стримов нашей команды: 🔹 Native Omnimodality & VLA 🔹 Omnimodal Reasoning & Tool-Call Никаких API-костылей и заморозки весов. Только фундаментальная архитектура, joint pretraining и работа на стыке AI, видео, аудио и робототехники. Задачи 🧠 Проектировать и имплементировать принципиально новые мультимодальные архитектуры (vision, audio, video, text) в едином латентном пространстве 🔮 Разрабатывать universal encoders и shared latent spaces, контрастивные и joint-эмбеддинги 🤖 Создавать VLA (Vision-Language-Action) пайплайны и стримы взаимодействия с роботами 📈 Исследовать RL-подходы для обучения reasoning-моделей с активным tool-calling 🎬 Обучать модели на длинных видео (>1 часа) и масштабных мультимодальных датасетах 🔬 Быстро разбирать идеи из статей и воспроизводить их Что ожидаем • Уверенный Python 3, PyTorch, bash, git, Docker • Глубокое понимание representation learning и multimodal learning • Опыт работы с мультимодальными LLM/VLM «под капотом» (не API-обёртки) • Понимание архитектуры трансформеров, contrastive learning, joint embeddings • Знание особенностей alignment современных LLM и reasoning-паттернов • Умение читать, декомпозировать и воспроизводить research-статьи ➕ Будет сильным плюсом • Опыт распределённого обучения • Реальный опыт pretraining мультимодальных моделей с нуля • Работа с video/audio модальностями, streaming data pipelines • Бэкграунд в VLA / embodied AI / robotics • Публикации, open-source вклад или академический или исследовательский опыт 💸 Почему у нас интересно 🔥 Честный RnD: мы не инициализируем претрейны весами Qwen, а учим с нуля 🌍 Влияние на архитектуры следующего поколения, а не на 10-й слой файнтюна 📚 Поддержка публикаций, поездок на конференции и open-source инициатив 🤝 Команда сильных исследователей + доступ к серьёзным вычислительным ресурсам 🚀 Чёткий путь: идея → исследование → эксперименты → деплой Контакты для резюме: @VeronikaShel @dmiryy Если у вас остались вопросы по вакансиям — @nagadit #hiring #job

4 016

🚀 xAI сдает свои GPU в аренду https://www.businessinsider.com/elon-musk-xai-compute-cursor-ai-model-training-2026-4 📌 TL;DR Громкий заголовок, за которым кроется главная проблема xAI: утилизация GPU крайне низкая — всего 11% (!!!) Илон Маск решил монетизировать свою гигантскую GPU-инфраструктуру: xAI планирует сдавать вычислительные мощности Cursor, который развивает популярного AI-кодинг-ассистента. Cursor будет использовать десятки тысяч GPU xAI (в рамках проекта Colossus) для обучения своей новой модели Composer 2.5. Фактически xAI превращается в облачного провайдера, вступая в прямую конкуренцию с AWS, Microsoft Azure, Google Cloud и т.д. Это не просто способ заработать, а попытка поднять MFU (Model FLOPs Utilization) — который в xAI сейчас всего 11% против 35-45% у конкурентов. 🤔 Зачем это xAI? 1. Огромные мощности и низкая эффективность У xAI уже есть около 200 000 GPU Nvidia, а планы — до 1 миллиона. Но эффективность использования (MFU) составляет всего ~11%. Президент xAI назвал это "embarrassingly low" и поставил цель достичь 50% в ближайшие месяцы. Сдача мощностей в аренду — классический способ «догрузить» простои и подтянуть эффективность. 2. Доступ к данным Cursor — это не просто кодер, это платформа, через которую тысячи разработчиков генерируют код. У Cursor есть доступ к уникальным данным о том, как люди реально пишут, правят и рефакторят код. Для xAI, которая тоже делает свои модели, это золотая жила. ⁉️А насколько эффективно ваши пайплайны загружают GPU-кластеры? #economy #gpu #xAI #cursor

4 016

🤖 AI in KZ 🇰🇿 Несколько дней назад посетили Казахстан 🇰🇿 с @oulenspiegel_channel , где прочитали лекции о развитии искусственного интеллекта: поговорили про прошлое, настоящее и будущее ИИ, и что нас ждёт в ближайшей перспективе. Получился не просто формат лекций, а очень насыщенный диалог с коллегами из разных министерств, спасибо за теплый приём! 🧠 О чем говорили? 🔹 Начал выступление @oulenspiegel с лекцией про следующее поколение нейросетевых моделей и каким будет мир после LLM. Часть материалов вы можете найти у Сергея в канале 👉 https://t.me/oulenspiegel_channel/5082 🔹 Затем дискуссию продолжил @hukenovs с техническим докладом об эволюции нейросетевых решений. В частности о том, какие революционные вызовы случались в области ИИ за последние 30 лет, где мы находимся прямо сейчас и что нас ждет в самом ближайшем будущем с практической точки зрения. 🔹 И завершил сессию @evgenijkkk с насыщенным и глубоким техническим докладом о последних успехах в развитии флагманской российском модели GigaChat, рассказав подробно о всех нюансах обучения моделей такого класса. Подробнее можно почитать на хабре. 📌 Немного фактов Министерство искусственного интеллекта и цифрового развития Республики Казахстан образовалось в сентябре 2025 года на базе нескольких министерств и является ключевым государственным органом, ответственным за технологическую трансформацию страны. Основные задачи: — Развитие экосистемы ИИ: Создание правовых, технических и образовательных условий для внедрения технологий ИИ в экономику и гос. управление. — Реализация стратегии "Цифровой Казахстан": Ускорение экономического роста и повышение качества жизни населения за счет цифровизации. — Создание суверенного ИИ: Разработка национальной языковой модели, развитие национальной инфраструктуры данных и вычислительных мощностей. — Регулирование и безопасность: Реализация Закона «Об искусственном интеллекте», обеспечение безопасности данных, прозрачности алгоритмов и ответственности при использовании ИИ. — Цифровизация отраслей: Внедрение ИИ в банковский сектор, IT-сферу, телекоммуникации, горнодобывающую промышленность, фармацевтику и ритейл. — Развитие человеческого капитала: Подготовка кадров в сфере IT и ИИ, развитие инновационной экосистемы. #ai #gigachat #kazakhstan

4 016

Repost from Data Engineer Jobs

🔥 Присоединяйся к дата-инженерной команде Управления экспериментальных систем машинного обучения SberAI — собираем данные для прорывных GenAI-моделей Привет! 👋 Мы — дата-инженерная команда внутри Управления экспериментальных систем машинного обучения SberAI. Наша миссия — поставлять качественные мультимодальные датасеты в продуктовые команды, которые развивают генеративные модели: speech, music, image, video, 3D, text. Чем будешь заниматься на самом деле: 🔍 Парсить открытые источники: YouTube, Telegram, Pinterest, HuggingFace, VK. 🧪 Генерировать синтетические данные через SOTA-модели (Qwen, Flux, Gemini и др.) — ты сам создаешь «топливо» для обучения. ⚙️ Оркестрировать ETL/ELT-пайплайны, фильтровать дубли, блюр, водяные знаки, нелегальный контент, оценивать реалистичность и эстетику. 👥 Организовывать проекты ручного сбора и валидации на крауд-платформах TagMe, Elementary, ЯЗ. Наш стек: 🛠 Python • SQL • S3 • Hadoop/GreenPlum • Airflow • Docker/K8s • Git • Vault • ML Space • Confluence • Jira Что нужно, чтобы стать своим: ✅ Знание Python (библиотеки для работы с данными и API) ✅ Опыт с ML-пайплайнами и датасетами для CV/NLP ✅ Понимание ETL/ELT и жизненного цикла данных ✅ SQL: SELECT, JOIN, агрегаты, подзапросы ✅ Базовое понимание форматов: CSV, JSON, Parquet, сериализация ✅ Опыт с Docker/Kubernetes Будет плюсом: 🌟 Airflow или другие оркестраторы Понимание облачных сервисов Почему тебе здесь понравится: 📍 Офис и формат: современный офис рядом с м. Кутузовская + гибридный график. Хочешь из дома — ок, хочешь в офис с корпоративным спортзалом и зонами отдыха — пожалуйста. 💰 Деньги и стабильность: ежегодный пересмотр зарплаты + годовая премия. 🏠 Ипотека для сотрудников — реальная возможность решить жилищный вопрос. 🩺 Забота о здоровье: расширенный ДМС с первого дня работы + страхование для семьи. 🎁 Бонусы: бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров, вознаграждение за рекомендацию друзей в команду Сбера. 📚 Рост: система обучения для профессионального и карьерного развития. Как попасть в команду? 🚀 Откликайся по ссылке: https://hh.ru/vacancy/132344139 https://t.me/rndml_team

4 016

Repost from (sci)Berloga Всех Наук и Технологий

🚀 Серия соревнований по МЛ и научный проект ! Денежный призовой фонд больше 150 000 р и будет расти ! Кому интересен МЛ/RL или математика или пазлы или роботы. Приглашаем Вас принять участие в серии челленджей и развитии научного опен-соурс проекта. Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении д.ф.-м.н. А. Арутюнова: https://t.me/forodirchNEWS/3165 , или хабре или чате @starkitmega. Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл. ~~Первый~~ Второй разыгрываемый приз - 10 000 рублей. Условия ~~первого~~ второго этапа очень простые. Есть три челленджа на Каггле Мегаминкс https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard Кубик Рубика 333 https://www.kaggle.com/competitions/cayleypy-ihes-cube Кубик Рубика 444 https://www.kaggle.com/competitions/cayley-py-444-cube Приз будет получен первым, кто достигнет ЛЮБУЮ из целей: 1 Или в конкурсе Мегаминкс - кто достигает скор 75 000 (вы получите 5 000 рублей, 70 000 ещё 5 000 рублей) и опубликует публичное решение. (Первая цель ~~80 000~~ уже достигнута. Приз уйдёт Владу Кузнецову, МФТИ). 2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов). Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogacompete @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве). Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи. Планируется серия челленджей и призов. Первый приз уже разыгран, второй объявлен, скоро будут новые объявления -- оставайтесь с нами ! ================ А также мы ищем Cпоносоров. Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505 Или напишите @alexander_v_c (Александр Червов) И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите: https://github.com/cayleypy/cayleypy ================ Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store ================ Выражаем благодарность агентству BLASTIM за поддержку: ❤️ Наши курсы: agency.blastim.ru 🥨 Свежие вакансии в биотехе: blastim.ru 🤝 https://t.me/blastim

4 016

🤖 GenAI на AiConf Приходите 20 апреля на AiConf 2026 послушать крутые доклады и мастерклассы, поиграть в Sber AI Simulator, а также посетите нашу GenAI-зону, где вы сможете пообщаться с нашим иммерсивным аватаром Ирочкой 🤗 . В Пространстве GenAI вас ждут углублённые мастер‑классы по генеративному ИИ — с реальными кейсами, инструментами и поддержкой экспертов. Напомним, что мы активно нанимаем как отдельных сильных кандидатов, так и целые команды AI-энтузиастов. На конференции вы сможете позадавать вопросы о наших технических и продуктовых стримах, а в случае успеха — пройти максимально упрощенный путь найма в RnD-департамент! Приходите, будет интересно! 😇 #conference #aiconf #hire

4 016

🚀 KVAE-2.0 is here! Несколько месяцев назад наши коллеги из Kandinsky Lab выпустили токенизаторы для видео и изображений — KVAE-1.0. А сегодня представляют следующее поколение: KVAE-2.0 — две новые модели, которые превосходят Wan 2.2 и HunyuanVideo 1.5 по объективным метрикам реконструкции и семантике генерации, по метрикам визуального качества генерации находятся в паритете с ними. Форматы: ▫️4x8x8 (апгрейд KVAE-1.0: 8x ширина/высота, 4x кадры). ▫️4x16x16 (более агрессивное сжатие). В разработке KVAE-2.0 особое внимание уделили diffusability — свойству латентного пространства, насколько оно подходит для диффузионных моделей. Коллеги рассмотрели актуальные тренды в токенизации видео, описали архитектурные изменения в KVAE-2.0 (включая сложности создания такого токенизатора). Все это подробно описано в статье на Хабр. 🔗 Модель t4s8 / Модель t4s16 🔗 Код на GitHub #kandinsky #release

4 016

♿ HearMe: Патент на AI-переводчик жестового языка от Abu Dhabi University https://www.wam.ae/en/article/bzm36g2-abu-dhabi-university-granted-patent-for-ai-powered 📌 TL;DR Abu Dhabi University (ADU) получил патент на HearMe — AI-приложение для двунаправленного перевода между жестовым языком и текстом в реальном времени. Поддерживает мультиязычность (американский, французский жестовый язык), работает в образовательных и профессиональных сценариях. Проект встраивается в национальную стратегию ОАЭ по поддержке People of Determination. Разработчики: Dr. Modafar Ati + выпускница Reem Al Bostami. HearMe — один из редких примеров, когда исследовательская разработка дошла до патента и ориентирована на мультиязычную реальность. В ОАЭ живут люди со знанием различных жестовых языков, и единого "арабского жестового" не существует. HearMe позволяет говорить на американском и французском жестовом языке внутри одной системы — это нетривиальная задача, которую авторы, судя по всему, решили через промежуточное семантическое представление (скорее всего, без привязки к конкретному языку жестов). 🧠 Зачем? Глобально около 430 млн. людей имеют нарушения слуха, но большинство инструментов коммуникации либо односторонние (текст → жест), либо ограничены одним языком жестов. В академической и рабочей среде это создаёт барьеры коммуникации. Авторы патента задают вопрос: можно ли создать масштабируемое решение, которое одновременно (1) работает в реальном времени, (2) поддерживает несколько жестовых языков и (3) интегрируется в существующие образовательные/корпоративные платформы? ⚙️ Интеграция — Классы / лекции: субтитрование + аватар для глухих студентов — Корпоративное обучение: доступ к материалам без человеческого переводчика — Публичные сервисы: демо-стенды, приложения с поддержкой жестового ввода 🌍 Мультиязычность Большинство современных моделей перевода обучаются под один язык жестов. HearMe заявляет поддержку нескольких систем (ASL, FSL и, вероятно, других). Как это достигается? — Либо через общее embedding-пространство (ImageBind-like подход: жесты → семантика → текст на любом языке), — либо через отдельные декодеры для каждого языка жестов при общем визуальном энкодере. Первый путь — более элегантный и масштабируемый, но сложный в обучении без больших параллельных данных. Второй — проще, но быстро раздувает модель. Какой выбрали авторы — остаётся загадкой до публикации патента или статьи. 🔗 Источник: WAM (Emirates News Agency), April 2026 | Abu Dhabi University #signlanguage

4 016

💸💸 Найм! 💸💸 Устал инициализировать претрейны весами Qwen? Приходи к нам, мы честно учим с нуля! Ищем Senior/Senior+ AI Engineer, а также продактов в RnD-команду! А если у вас есть небольшая команда и вы хотите прийти к нам полным составом — пишите, рассмотрим! 👥 О нас: Мы — управление экспериментальных систем машинного обучения (УЭСМО или RnD ML), разрабатываем прорывные AI-решения. 🤖 Native Omnimodality & VLA Создание нативных омнимодальных архитектур, новых способов кодирования и совместного обучения в доменах изображений, аудио, видео и т.д. Разработка принципиально новых представлений и кодирования информации, а также стрим VLA взаимодействия с роботами 🤖 🚀 LLM "bleeding edge" R&D Эксперименты с архитектурами LLM, оркестрация моделей, разработка прототипов агентных фреймворков и перспективных подходов к обучению, исследования по всему фронтиру современного LLM-строения. 🎙️ Native Speech & Audio Editing Разработка омнимодальной Full-Duplex архитектуры, которая слышит, говорит, нативно понимает перебивания и одновременно работает с речью, текстом и визуальной информацией. Проектирование архитектуры инструктивного редактирования в домене аудио. 🎼✨ 🧠 Omnimodal reasoning Задачи имплементации нативного латентного и омнимодального ризонинга в LLM и VLM. Мультимодальный reasoning и синхронизация потоков разных модальностей (audio–text–vision), включая стримы UI и VLA. 💻 Computer Operator Задачи управления компьютерами, телефонами, браузерами и т.п. Мы прицельно улучшаем работу моделей в этих задачах, используя передовые методы обучения (такие как online RL в средах). 🔎 Benchmarking Занимается передовыми исследованиями в области LLM и мультимодальных моделей, AI-агентов и LM-as-Judge. Создаем новые подходы к оценке, обучаем генеративные модели и исследуем их способности. Результаты представляем на ведущих конференциях высшего уровня А/А*, а также применяем в продуктах. 👩‍💻 Product Manager Ищем PM в команду, которая работает на переднем крае технологий. Никакой поддержки легаси — только R&D, early stage и high uncertainty. Здесь не работает подход «собрал требования — передал в разработку». Мы превращаем свежие исследования в MVP, структурируем хаос и проверяем гипотезы в условиях, когда готового решения нет. 🛠 Data Engineering Ищем дата-инженеров, которые будут выстраивать сложные мультимодальные пайплайны сбора, разметки, валидации данных для обучения моделей во всех перечисленных выше ML-стримах. 📩 В сообщении укажите, на какую позицию откликаетесь! Контакты для резюме: @VeronikaShel @dmiryy Если у вас остались вопросы по вакансиям — Технический стрим: @hukenovs Продуктовый стрим: @Valentina_Khlebutina #job #hiring