Yandex Infrastructure
Открыть в Telegram
Рассказываем как мы делаем внутреннюю инфраструктуру Яндекса Сайт: https://infra.yandex.ru Чат для общения: https://t.me/ya_infra Вакансии: https://yandex.ru/jobs/services/infrastructure
Больше4 563
Подписчики
-124 часа
+197 дней
+28430 день
Архив постов
+4
🗒️ Встречаемся в понедельник: рассказываем, что будет на митапе по Annet
В карточках собрали темы, с которыми выступят коллеги 29 июня в Москве на второй встрече про Annet и стек автоматизации для сетевых инженеров и разработчиков.
Расскажем, что делаем мы и куда развиваем автоматизацию. А ещё будем много общаться: хотим послушать ваши истории внедрения и эксплуатации.
⏪️Регистрируйтесь тут⏩️
«Зачем мы делаем ❤️❤️❤️? Чтобы синхронизироваться с внешним миром».Собрали в видео впечатления наших коллег и гостей конференции. А ещё сделали плейлист с записями всех выступлений — можно заново погрузиться в доклады.
+8
🖥️ Как устроен шедулинг стримов в видеоплатформе
Привет! На связи Сергей Шепелев, я руковожу backend-разработкой Видеоплатформы для live-трансляций. На её основе мы разработали платформу для внешних клиентов, Yandex Cloud Video. И одна из нетривиальных задач внутри — шедулинг стримов.На первый взгляд всё просто: есть поток → его нужно транскодировать → отдать зрителям. Но на практике это не так. Во-первых, стримы бывают очень разными по нагрузке — и шедулить их одинаково не получается. Во-вторых, хосты иногда деградируют или падают, и стрим нужно быстро и безопасно переселить. ❤️ И вот тут начинается интересное.
❤️❤️Окей, рассказываем как мы улучшаем энергоэффективность наших дата-центров.
1️⃣ Используем фрикулинг и ликвидкулинг
Охлаждаем оборудование уличным воздухом. Так мы снижаем потребление энергии, сокращаем капитальные затраты и эффективнее используем площадки дата-центров. Про жидкостное охлаждение уже рассказывали тут.
2️⃣ Развернули собственные лаборатории и испытательные стенды
Проверяем покупные и собственные разработки, чтобы передавать в эксплуатацию гарантированно работоспособное оборудование.
3️⃣ Автоматизировали работу с инцидентами
Отслеживаем состояние сервера более чем по 200 параметрам. Часть поломок устраняется автоматически, остальные исправляют сотрудники. Один человек может обслуживать несколько тысяч серверов.
4️⃣ Оптимизировали модели, архитектуру и вычислительные системы
В 2025 году вдвое сократили стоимость инференса и ускорили обработку запросов в Алисе AI в 5,8 раз. В итоге снизили себестоимость использования ИИ и ускорили его масштабирование в массовых продуктах.
⚡️ 1,12 PUE
Вот так эффективно используют электроэнергию наши дата-центры. И это при том, что их общая мощность выше 200 МВт. Для сравнения, среднемировой PUE в 2025 году стоял на отметке 1,54.На каждые 100 Вт энергии, которую потребляет IT-оборудование, только 12 (!) расходуется на работу охлаждения, вентиляции, освещения и других вспомогательных систем. Кстати, наша энергоэффективность и забота об экологии стали вдохновением для Валерии Титовой, художницы и арт-директора нейросетевых проектов. Посмотрите на её работу в арт-галерее «Афишируем хорошее».
❤️ Если наберём 40 любых реакций, расскажем, за счёт чего мы пришли к таким цифрам.
Это пост с материалами infra.conf'26. Чтобы вам было удобнее, сохраним его и в закрепе канала:
📎 Фотографии
📎 Записи на сайте в блоке программы
📎 Стикерпак в телеграм
📎 Презентации
И дублируем ссылки на формы для отзывов, если вы хотели поделиться впечатлениями, но ещё не сделали этого:
➡️ Отзыв о конференции
➡️ Оценка докладов
У тех, кто ставит ❤️ посту записи грузятся в более высоком качестве.
Спросили у вас про самые недооцененные качества в IT, особенности работы в инфраструктуре и аспекты работы инженером. Вот, что вы ответили нам на infra.conf'26
❤️ — лайк за доброту
🖥️ 2022 и 2023 годы — эпоха автодополнения. ИИ-ассистенты помогали справляться с типовыми задачами быстрее, но как только задача выходила за шаблон и требовала понимания всего проекта целиком, ломалось качество.
К 2024 году модели научились обрабатывать больше текста и уже не просто писать ответы, а выполнять действия и обращаться к базам данных. Ещё научились рассуждать: сначала выстраивать логическую цепочку шагов, потом выдавать результат. Так появился ИИ-агент — автономная система, способная решать задачи в несколько шагов без постоянного участия человека.
⏩️ А как обстоят дела с ИИ-агентами сейчас? Давайте расскажу! На связи я, Дмитрий Иванов, руководитель SourceCraft в Yandex Infrastructure. Полная статья.
infra.conf'26 завершилась — и мы хотим услышать ваше мнение.
Поделитесь впечатлениями в формах по ссылках:
➡️ Отзыв о конференции. ➡️ Оценка докладов.❤️Читаем каждый ответ — без исключений.
🔄 Как я сделал сканер под iOS и Android для диагностики Wi-Fi-сети
Привет! Я Павел Семенищев, сетевой инженер в Yandex Infrastructure. Наша команда отвечает не только за магистральные и дата‑центровые сети, но и за офисные, которые включают склады и дарксторы Яндекс Лавки. А это ОЧЕНЬ много удалённых точек присутствия, и при проблемах с Wi-Fi на каждую сетевика не отправишь.
Для быстрого сканирования параметров сети сотрудниками на местах я создал WiProber под Android и WiFi Prober под iOS — получился сетевой «комбайн» для инженера, который сначала был нашим внутренним инструментом, а теперь есть и в общем доступе.Рассказываю, что умеет каждое приложение, и какие ограничения ОС удалось обойти при создании.
⏩️ Ссылка на App Store ⏩️ Ссылка на APK и репозиторий
❤️ Инфраструктура — сердце Яндекса… И мы хотим открыть его вам ❤️
На фесте YOUNG CON 25 июня в Москве.
Расскажем, как мы создаём и развиваем продукты и технологии, на которых работает весь Яндекс.
На фестивале будет масштабная программа для карьерного буста школьников, студентов и начинающих специалистов. Сможете попробовать себя в пробном интервью, сходить на карьерную консультацию, ярмарку вакансий или просто понетворкать со стажёрами.
Регистрируйтесь на офлайн-участие на сайте до 13 июня и там же изучайте все активности.
Если давно следите за нашей командой и хотите карьерных перемен, приходите вместе строить и развивать инфраструктуру. Свежую подборку оставляем ниже, а все открытые позиции изучайте на сайте.
⏩️ Разработчик бэкенда в DistBuild
Ищем коллегу, который разрабатывает на C++ и хорошо знает Linux. Ему предстоит улучшать эффективность кластера, повышать стабильность сервиса и решать крупные вызовы.⏩️ Go-разработчик в платформу управления инфраструктурой
Вакансия для специалиста, который занимался промышленной разработкой на Go больше трёх лет. Вы будете развивать ядро платформы, laC-сценарии управления инфраструктурными компонентами и утилиту CLI.⏩️ Java-разработчик в команду систем непрерывной интеграции и развёртывания
На этой позиции вы будете разрабатывать распределённую CI/CD-платформу, которую используют команды Яндекса для проверки пул-реквестов и ежедневной выкатки тысяч релизов.⏩️ ML-разработчик в группу развития агентских решений
Наш будущий коллега будет развивать AI-агентов, проектировать схемы взаимодействия агентов и внедрять метрики оценки качества.⏩️ Инженер в группу поддержки облачной платформы
Вакансия для специалиста, который уже настраивал Nginx/Envoy, знает стек TCP/IP и HTTP(S), любит искать причины технических неисправностей и помогать пользователям решать проблемы.⏩️ Техлид в команду Identity Manager
Вакансия для опытного Go-разработчика в IDM. Вместе с командой вам предстоит пересмотреть архитектуру сервиса, а также разрабатывать новые фичи и сервисы.
Ну и традиционное: ❤️❤️❤️ — всё!На фото — команда, которая сделала конференцию такой, какой вы её увидели. Спасибо, что провели сегодняшний день с нами офлайн и онлайн. ❤️ — спасибо за конфу Поделиться впечатлениями можно в комментариях и в форме обратной связи, которой мы скоро поделимся с участниками.
+8
Делимся фотографиями прямиком с площадки
❤️❤️❤️.
Уже? Да!
❤️ — А когда будут все фотки и записи выступлений? Примерно через две недели поделимся всеми материалами конференции в отдельном посте
🔄 В прямом эфире infra.conf'26 мы проведём серию блиц-интервью об управлении техническими командами.
Интервью проведут Анастасия Абрашитова, руководитель отдела DevTools в Яндексе, и Евгений Антонов, ведущий технический менеджер проектов Yandex Infrastructure
Вместе с гостями разберем четыре ситуации:
⏩️ Александр Чубинский, руководитель Yandex Platform Engineering — расскажет про организационное построение крупного инфра-юнита.
⏩️ Андрей Годин, руководитель Yandex Infrastructure — ответит на вопросы о том, как не терять связь с командой, когда ты руководитель высокого уровня.
⏩️ Андрей Ривкин, руководитель ML-млатформы — поделится тем, как управлять без полномочий.
⏩️ Антон Кортунов, технический лидер в Yandex Infrastructure — расскажет, каково это уйти из хардкорного технаря в руководство и обратно.
⏩️ Евгений Сафронов, руководитель команды NocDev – обсудит управление ИИ-агентами.
Подключайтесь к нашей трансляции к 14:35, чтобы послушать разбор тимлидских практик. Вторая часть интервью будет в 17:05.
Чтобы быстрее внедрять ИИ в сервисы Яндекса, мы модернизировали подход к строительству и охлаждению дата-центров. Инфраструктура — это то, от чего напрямую зависит, как скоро пользователи получат доступ к новым технологиям.
Держите часть анонсов — и присоединяйтесь к трансляции, остальные доклады ещё впереди.
🔄 Концепция кампусов дата-центров
Для поддержания растущих ИИ-нагрузок мы изменили подход к размещению вычислительных мощностей. Мы внедряем новую концепцию — кампус дата-центров, объединяющий несколько независимых ДЦ в одной географической локации. Текущая мощность — 50 МВт, целевая мощность кампуса — 180 МВт. Это эффективнее с точки зрения ресурсов, издержек и роста вычислительных потребностей.🔄 Переходим на жидкостное охлаждение
Рост ИИ-нагрузок требует нового подхода к охлаждению серверов. Поэтому мы устанавливаем в дата-центрах сайдкары — дополнительные стойки с жидкостными радиаторами. Это позволяет охлаждать оборудование без масштабной реконструкции дата-центров — и заодно делает наши ДЦ ещё эффективнее: текущий PUE 1,1 сможет стать ещё ниже.
Хотим знать, как проходит ваш день на infra.conf’26 и запускаем
🔤🔤🔤🔤🔤🔤🔤
Условия такие:
⚫️ быть подписанным на канал @yandex_infrastructure
⚫️ отправить в комментарии к этому посту фотографию с конференции. Если вы офлайн, можете поделиться кадрами с коллегами или с докладов. Если присоединились онлайн, покажите, где и как слушаете спикеров.
Итоги подведём сегодня в 17:00 в комметариях к этому посту: случайным образом выберем 5 фотографий и отправим их авторам небольшие памятные подарки — мерч от нашей команды.
❤️ — фотографий у меня много, участвую!
10 минут и мы начинаем infra.conf’26⚡️
⏪️ Самое время подключиться к трансляции или занять удобное место в зале ⏩️Если пригодится, вот тут можно найти программу: ⚫️трек Infra; ⚫️трек Platform; ⚫️трек ML. Вопросы по докладам задавайте в чате. ❤️— уже встретились с коллегами офлайн, ждём спикеров 🔥— ноут заряжен и готов к онлайн-трансляции
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
