ru
Feedback
Вокруг Kubernetes в VK

Вокруг Kubernetes в VK

Открыть в Telegram

Делимся новостями из мира Kubernetes и DevOps. А еще рассказываем про кластеры K8s в облаке VK Cloud https://cloud.vk.com/containers Мы в MAX: https://max.ru/k8s_vk

Больше
4 374
Подписчики
Нет данных24 часа
-97 дней
-3030 день
Архив постов
⚡️ Почему GPU-нагрузки плохо масштабировать по CPU Для vLLM, Triton, batch-инференса и обучения моделей стандартных метрик CP
⚡️ Почему GPU-нагрузки плохо масштабировать по CPU
Для vLLM, Triton, batch-инференса и обучения моделей стандартных метрик CPU и памяти часто недостаточно.
Основная нагрузка уходит в GPU, поэтому масштабирование лучше строить по сигналам ускорителя: • утилизация GPU • использование VRAM • температура • энергопотребление Для этого KEDA нужно передать метрики, которых у нее нет из коробки. В статье разобрали, как добавить их через внешний скейлер. 🔧 Как это работает: • на GPU-нодах запускается DaemonSet • он читает локальные метрики через NVML • передает их в KEDA по gRPC через ExternalScaler • KEDA управляет масштабированием нагрузки через HPA Для типовых сценариев есть готовые профили: vllm-inference, triton-inference, training и batch.
Например, vLLM deployment можно масштабировать по использованию памяти GPU и уводить в scale-to-zero при простое.
Читайте на Хабре, как собрать внешний GPU-скейлер для KEDA и настроить автоскейлинг GPU-нагрузок в Kubernetes 🔗 Мы в MAX

Войдите в экспертный совет АОТ 🔝 АОТ — это Ассоциация облачно-ориентированных технологий, которую основали VK Cloud, Yandex
Войдите в экспертный совет АОТ 🔝
АОТ — это Ассоциация облачно-ориентированных технологий, которую основали VK Cloud, Yandex Cloud и «Флант», чтобы популяризовать Cloud Native-технологии на российском рынке.
🚀 Сейчас АОТ собирает экспертный совет: это девять ведущих практиков в области облачно-ориентированных технологий и Kubernetes. Они будут определять технологическую повестку ассоциации, участвовать в запуске отраслевых инициатив, технической валидации подходов и практик. В экспертный совет приглашают профессионалов, желающих влиять на развитие технологий и обладающих практическим опытом в cloud-native и Kubernetes. Важно, чтобы у кандидатов был подтвержденный экспертный вклад в индустрию — статьи, выступления, open-source-проекты, а также готовность уделять 10-20 часов в месяц инициативам и задачам совета 📚 Подробнее про совет и требования к кандидатам — на сайте ассоциации: заходите, изучайте и подавайте заявки до 22 июля. Результаты отбора появятся в официальных каналах АОТ в августе 2026 года.

Ускорьте ИИ-нагрузки на 15% С Managed Kubernetes на физических серверах Managed Kubernetes автоматизирует развертывание и обс
Ускорьте ИИ-нагрузки на 15% С Managed Kubernetes на физических серверах Managed Kubernetes автоматизирует развертывание и обслуживание приложений — вам не придется вручную следить за инфраструктурой и держать для этого отдельную команду. 👆 Раньше такие кластеры работали поверх виртуальных машин, теперь — прямо на «железе». Платите только за полезные вычисления и используйте всю мощность видеокарт. Новое поколение сервиса Managed Kubernetes рассчитано на экстремальные нагрузки: один кластер выдерживает до 55 000 микросервисов одновременно с гарантированной доступностью 99,95%. 🔧 Настройку, масштабирование и обновление можно запускать параллельно, что сокращает время вывода продуктов на рынок и снижает объем ручной работы. Такое решение отдает под расчеты 100% мощности графических процессоров и ускоряет работу с ИИ-нагрузками на 15%.
Запускать высоконагруженные и ИИ-приложения можно в четырех зонах доступности VK Cloud, полностью контролируя ресурсы и сохраняя привычное удобство облака. Инфраструктура отвечает требованиям 152-ФЗ, стандартам ISO и PCI DSS, а дата-центры аттестованы по 21 приказу ФСТЭК.
➜ Протестируйте Managed Kubernetes по ссылке 🔗 Мы в MAX

Видеосообщение00:39

Если вы еще не видели сегодняшний доклад Саши — вы знаете, где его искать 👀

Мы входим в эпоху Cloud-Native AI 🤖 Что ее характеризует? • Managed k8s c GPU из коробки • автомасштабирование GPU-нод • MIG
+4
Мы входим в эпоху Cloud-Native AI 🤖 Что ее характеризует? • Managed k8s c GPU из коробки • автомасштабирование GPU-нод • MIG, vGPU, разделение по времени использования • S3 CSI для больших датасетов • ZeroOps для ML-платформ Как в соответствии с этим меняется инфраструктура для ИИ-нагрузок? Какое место занимает в ней Managed Kubernetes? Об этом Александр Прохоров, эксперт команды Developer Productivity VK Cloud, рассказал на VK Cloud Conf 2026. Смотрите запись трансляции на сайте конференции. 🔗 Мы в MAX

Repost from VK Cloud
⏰ VK Cloud Conf стартует через 10 минут Делимся ссылками на трансляцию: • VK ВидеоСайт VK CloudCNews — на главной странице Дзен — в теме «ИТ» Ждем вас на площадке и онлайн 💙

В Managed Kubernetes теперь доступен аддон S3-CSI — решение для проектов, которые работают с большим объемом пользовательских
В Managed Kubernetes теперь доступен аддон S3-CSI — решение для проектов, которые работают с большим объемом пользовательских или системных файлов 🔗 Он позволяет подключить S3-хранилище напрямую к приложению в качестве диска. С какими задачами поможет S3-CSI: Упростить масштабирование: вы сможете управлять количеством подов без риска потерять данные благодаря одновременной работе с общими файлами в S3. Снизить затраты: хранить файлы, архивы и копии в S3 значительно дешевле, чем на стандартных дисках. Защитить от нехватки места: безлимитное объектное хранилище избавляет от необходимости вручную расширять диски при росте объема данных. Обеспечить постоянный доступ: файлы изолированы от жизненного цикла контейнеров и остаются на месте даже при перезапуске всех подов. ☑️ Как активировать: выберите S3-CSI в списке расширений при создании или настройке кластера в панели управления VK Cloud. Узнайте, как установить и настроить аддон ➜ 🔗 Мы в MAX

🧩 Pod не стартует? Проверьте env от Service Service в Kubernetes дает стабильный доступ к группе Pod. При этом данные о Serv
🧩 Pod не стартует? Проверьте env от Service Service в Kubernetes дает стабильный доступ к группе Pod. При этом данные о Service по умолчанию добавляются в Pod как переменные окружения. Эта деталь может неожиданно повлиять на запуск приложения.
Например, Service с именем server сгенерирует env SERVER_PORT. Если приложение ждет в этой переменной число, а получает строку вида tcp://<ClusterIP>:<port>, запуск может завершиться ошибкой.
Еще один сценарий — большое количество Service и портов в Namespace.
Набор env разрастается, контейнер упирается в лимит ядра и падает с ошибкой: argument list too long.
Поэтому при странных ошибках запуска стоит проверить Service в Namespace и env, которые попадают в Pod. 💙 Что помогает снизить риск: • отключать автоматические env от Service через enableServiceLinks : false • явно задавать критичные env в манифестах • ограничивать количество Service и портов • защищать Service kubernetes в namespace default от изменений В статье разобрали, как Service влияет на env в Pod, почему это может ломать приложения и какие настройки помогают защититься. Читайте статью на Хабре 🔗 Мы в MAX

Александр Прохоров, эксперт команды Developer Productivity VK Cloud, приглашает на VK Cloud Conf 2026 💙 17 июня в Москве обсудим, как Managed Kubernetes в VK Cloud превращается в высокопроизводительную платформу для ИИ-нагрузок. Рассмотрим автоматизацию администрирования, эластичность и масштабирование, работу с большими массивами данных. Регистрируйтесь на конференцию ➜ 🔗 Мы в MAX

🛡️ CI/CD может стать точкой входа в атаку Если злоумышленник доберется до сборочного пайплайна, проблема может попасть дальш
🛡️ CI/CD может стать точкой входа в атаку
Если злоумышленник доберется до сборочного пайплайна, проблема может попасть дальше — в контейнерные образы, Helm-чарты и пользовательские кластеры.
👆 Для Cilium это особенно критично. Он работает в сетевом пути уровня ядра Linux и используется в Kubernetes-кластерах для сетевой связности, политик безопасности и наблюдаемости трафика. Про возможности Cilium в Managed Kubernetes VK Cloud рассказывали здесь В статье разбираем, как Cilium защищает цепочку поставки проекта: от запуска CI-workflow до проверки релизных артефактов. ⚙️ Что делает на практике: • ограничивает, кто может запускать CI-workflow • разделяет доверенный код и код из pull request • закрепляет GitHub Actions по SHA, а образы — по digest • изолирует production-учетные данные от CI-сборок • подписывает релизные образы и Helm-чарты через Sigstore Cosign Так каждый уровень снижает зону поражения, если один из участков пайплайна окажется скомпрометирован. Читайте на Хабре, как Cilium защищает CI/CD 🔗 Мы в MAX

Repost from VK Cloud
Автоматизируйте релизы в Managed Kubernetes 🛠 Для команд с активной разработкой в Managed Kubernetes на платформе VK Cloud д
Автоматизируйте релизы в Managed Kubernetes 🛠 Для команд с активной разработкой в Managed Kubernetes на платформе VK Cloud доступен аддон Argo CD. Он автоматизирует доставку кода из репозиториев в кластер, избавляя от рутины при развертывании приложений. Какие задачи решает Argo CD:Ускоряет выкатку обновлений. Как только код одобрен, изменения сразу применяются в кластере без участия инженеров. ➕ Защищает продакшн от сбоев. Если новое обновление вызвало сбой в приложении, вы мгновенно возвращаете кластер к стабильной версии через историю изменений в репозитории. ➕ Сверяет состояние кластера с эталоном в Git и сам исправляет случайные ручные правки. Как начать использовать:
Выберите Argo CD при создании или настройке кластера Managed Kubernetes в панели управления VK Cloud — он подключится автоматически.
Читайте подробнее в документации 🔗 Мы в MAX

В Managed Kubernetes теперь доступен аддон KGateway – инструмент для публикации приложений и управления трафиком 🔗 Он постро
В Managed Kubernetes теперь доступен аддон KGateway – инструмент для публикации приложений и управления трафиком 🔗 Он построен на базе популярного прокси-сервера Envoy и использует современный стандарт Gateway API. KGateway приходит на смену Ingress Nginx, который постепенно снимается с поддержки.  Почему стоит перейти на KGateway: ➕ Нативная поддержка Gateway API. Стандарт разделяет зоны ответственности администраторов кластера и разработчиков, делая управление маршрутами прозрачнее. ➕ В основе аддона – Envoy. Это один из самых быстрых и масштабируемых сетевых прокси в облачной инфраструктуре. ➕ Если вы ищете альтернативу Ingress Nginx для публикации сервисов, KGateway обеспечит привычную функциональность с расширенными возможностями. ➕ Аддон подключается в несколько кликов при создании или настройке кластера в панели управления VK Cloud. Узнайте, как установить и настроить аддон ➜ 🔗 Мы в MAX

⚡️ Как PySpark-задача запускается в Cloud Spark В Cloud Spark запуск начинается с клиентской Python-библиотеки: пользователь
⚡️ Как PySpark-задача запускается в Cloud Spark В Cloud Spark запуск начинается с клиентской Python-библиотеки: пользователь создает манифест задания, указывает PySpark-скрипт и параметры выполнения, а затем отправляет задачу через spark.submit(). Дальше подключается инфраструктурный слой на базе Managed Kubernetes: Spark Operator управляет запуском, масштабированием и завершением приложения • S3-хранилище используется для датасетов, логов и внешних зависимостей • Spark History Server помогает смотреть историю выполненных заданий • Private Docker Registry хранит готовые образы Spark 💙 Чтобы вам было легче разобраться, разложили все по шагам: от запуска PySpark-заданий до автомасштабирования и коннекторов к Kafka, ClickHouse, MongoDB и S3-хранилищу. Читайте статью в блоге VK Cloud 🔗 Мы в MAX

Упростили работу с приватными репозиториями в Kubernetes ⛅️ Добавили новую возможность при создании кластеров Managed Kuberne
Упростили работу с приватными репозиториями в Kubernetes ⛅️ Добавили новую возможность при создании кластеров Managed Kubernetes — настройку доверенных Docker Registry. Теперь вы можете указать адреса репозиториев, для которых не требуется проверка подлинности HTTPS-соединения. Обновление будет особенно полезным для команд, которые используют локальные реестры образов с самоподписанными сертификатами. 💙 Почему это удобно: • больше не нужно настраивать доверие к самоподписанным сертификатам на каждом узле вручную – кластер примет их автоматически • список доверенных адресов можно указать прямо в мастере создания кластера • при добавлении IP-адресов (с указанием порта и без) и произвольных доменов настройки применяются ко всем узлам, включая те, что будут добавлены позже при масштабировании 🔧 Настроить доверенные репозитории можно уже сейчас в личном кабинете VK Cloud при создании нового кластера. ➜ Читайте подробнее про новые возможности 🔗 Мы в MAX

Как обеспечить отказоустойчивость в Kubernetes? ➜ Скачать гайд от команды VK Cloud Мы собрали подробное руководство, которое
Как обеспечить отказоустойчивость в Kubernetes? ➜ Скачать гайд от команды VK Cloud Мы собрали подробное руководство, которое поможет вам разобраться в практиках построения отказоустойчивых систем на базе Kubernetes. Внутри — ключевые принципы проектирования и эксплуатации, позволяющие минимизировать риски на всех уровнях 🔝 Вы узнаете: • как обеспечить отказоустойчивость баз данных и других stateful-приложений в Kubernetes • как настроить автоматическое восстановление и масштабирование приложений в k8s при сбоях • как организовать резервное копирование и тестирование планов аварийного восстановления для k8s • и многое другое Вы можете получить гайд бесплатно, достаточно заполнить форму на сайте 💙

Архитекторы цифрового будущего, объединяйтесь 💪 На VK Cloud Conf 2026 17 июня ждем вас на облачной конференции VK Tech для б
Архитекторы цифрового будущего, объединяйтесь 💪  На VK Cloud Conf 2026  17 июня ждем вас на облачной конференции VK Tech для бизнеса и разработчиков.  До обеда программа будет идти по общему треку, а после разделится на два ключевых направления — технологии и бизнес-кейсы. 🔹 Безопасная разработка: Security Gate, Registry и контроль уязвимостей от сборки до продакшена. 🔹 ИИ-инфраструктура: LLM Proxy, Bare Metal + GPU, Managed Kubernetes с поддержкой ИИ-нагрузок. 🔹 Данные и аналитика: лейкхаус-архитектура, инструменты для подготовки данных к ML. 🔹 Масштабируемое хранение: S3 для больших данных, неудаляемые бэкапы. 🔹 Кейсы крупных компаний и дискуссия: позовем экспертов из ритейла, финтеха и промышленности, чтобы поговорить о том, как они строят безопасную и производительную инфраструктуру для бизнес-критичных систем в облаке. Хотите подробнее узнать о докладах, которые мы для вас приготовили? Ставьте 🔥 под постом и следите за обновлениями в канале. 

📈 Ускоряйте сеть и экономьте ресурсы узлов В Managed Kubernetes для проектов с высокими требованиями к скорости сети доступе
📈 Ускоряйте сеть и экономьте ресурсы узлов В Managed Kubernetes для проектов с высокими требованиями к скорости сети доступен плагин Cilium. За счет работы на уровне ядра Linux он снижает сетевые задержки и разгружает процессоры рабочих узлов. 💙 В чем преимущества Cilium: • кластер тратит меньше мощности процессоров на маршрутизацию трафика • освободившиеся ресурсы идут на работу ваших приложений • сетевые пакеты передаются быстрее, что важно для высоконагруженных микросервисов и баз данных с интенсивным обменом • сетевые политики безопасности можно настраивать до конкретных API-запросов, а не только по IP-адресам • наглядная карта сетевых потоков упрощает поиск ошибок и мониторинг ☑️ Как активировать: выберите Cilium в списке CNI при создании кластера — он подключится автоматически. Узнайте больше о Cilium в VK Cloud

Создаем цифровую среду с VK Cloud 🤝 Знаем, что вы ждали этого так же, как и мы. 17 июня возвращается наша главная облачная к
Создаем цифровую среду с VK Cloud 🤝 Знаем, что вы ждали этого так же, как и мы. 17 июня возвращается наша главная облачная конференция — VK Cloud Conf. В этом году превратим площадку в неоконструкторское бюро. Присоединяйтесь, чтобы вместе с нами спроектировать технологическое будущее страны 🔥 Что в планах? • покажем, как строить безопасную и производительную инфраструктуру для бизнес-критичных систем в облаке • представим новые сервисы облачной платформы • расскажем про планы развития VK Cloud • эксклюзивно презентуем исследование рынка ИИ России с прогнозом развития на 2026–2030 годы Зафиксируем главное: 🗓 17 июня в 10:00 📍 Офлайн в Москве с трансляцией онлайн ➜ Приходите строить прогресс вместе с нами. Регистрируйтесь с корпоративной почты и дождитесь подтверждения

Repost from VK Cloud
Увидимся через неделю 🤖 На конференции AI Dev Conf от Jug Ru Group 21 мая встречаемся онлайн на конференции о применении AI
Увидимся через неделю 🤖 На конференции AI Dev Conf от Jug Ru Group 21 мая встречаемся онлайн на конференции о применении AI в SDLC. Спикеры обсудят: • как внедрить AI в полный цикл разработки • как AI влияет на процессы разработки ПО • могут ли агенты полностью взять на себя планирование, написание кода, ревью и тестирование? Конференцию закроет круглый стол «Потребности IT и возможности AI». К дискуссии присоединится Алексей Тотмаков — CTO VK Tech. Он расскажет о том, как устроен процесс внедрения ИИ в разработку в VK Tech. До встречи в онлайне 👋