KazDevOps
Открыть в Telegram
Канал о DevOps во всех проявлениях: K8s, CI/CD, HighLoad, AI/ML, Cloud, Linux Возьмем на поддержку DevOps: https://core247.kz/ По рекламе @UlKonovalova
Больше6 604
Подписчики
-224 часа
-17 дней
+5030 день
Архив постов
6 601
🔥 Результаты тестирования Alem.Cloud — казахстанского национального суперкомпьютера
АО «Национальные
информационные технологии»
(NITEC) развернул национальный суперкомпьютер Alem.Cloud.
Технические специалисты NITEC совместно с международными партнерами провели комплексное тестирование по методологии HPL (Linpack), глобальному эталону вычислительной мощности, чтобы замерить производительность системы и подтвердить ее готовность.
C радостью и гордостью сообщаем, что Alem.Cloud занял 86 место в международном рейтинге самых мощных вычислительных систем мира — TOP500. Желаем коллегам дальнейших успехов в их проектах!
@DevOpsKaz 😛
6 601
👀 Постмортем сбоя Cloudflare 18 ноября
Сегодня мы подвели весь интернет. Проблема в сети Cloudflare ударила по огромным объёмам трафика. Сайты, компании и организации, которые используют Cloudflare, рассчитывают на нашу доступность, и я прошу прощения за тот ущерб, который мы причинили. Это не была атака. Та проблема, тот ущерб, который она вызвала, и то, сколько заняло восстановление — всё это неприемлемо18 ноября 2025 года, Cloudflare устроил глобальный сбой — с 11:20 до 17:06 UTC (почти 6 часов хаоса). Это была классическая "тихая бомба" в конфигурации. Хронология событий:
11:20 Начало деградации — трафик не проходит через сеть Cloudflare. Пользователи видят HTTP 5xx-ошибки.
11:20–12:00 Подозрение на DDoS, статус-страница тоже падает.
12:00–14:30 Диагностика: проблема в Bot Management. Конфигурационный файл (feature file для ML-модели ботов) удвоился из-за бага в ClickHouse-запросе (дубликаты строк). Файл превысил лимит размера, вызвав краш в прокси-софте (FL и FL2).
14:30 Основной трафик восстанавливается — остановили распространение файла и вернули старую версию.
14:30–17:06 Зачистка последствий — повышенная нагрузка от возвращающегося трафика. Полное восстановление.
Затронутые сервисы:
⚪️ Core proxy (FL/FL2) — 5xx-ошибки
⚪️ Workers KV и Access — сбои
⚪️ сайты с bot-blocking правилами — ложные срабатывания (бот-скоры = 0)
Корень проблемы:
Баг в правах базы данных (ClickHouse) — дубликаты записей в feature file (конфиг для ML-модели Bot Management). Файл обновляется каждые несколько минут и распространяется по сети для адаптации к бот-угрозам.
👉 Смотреть полный разбор инцидента
@DevOpsKaz 😛6 601
🔥 PROFIT Education Day 2025 — роль ИИ в образовании
21 ноября, 9:20 Алматы, ул. Желтоксан, 181, InterContinental Almaty Регистрация уже открытаИз года в год PROFIT Events собирает качественную аудиторию, крутые кейсы и лучших IT-спикеров, знающих все о цифровизации. В этот раз тема встречи — ИИ в образовании. На конференции продемонстрируют международный опыт, расскажут о тенденциях развития ИТ-индустрии, о новых образовательных программах и решениях. Также можно будет обменяться практическим опытом с коллегами, запланировать пути сотрудничества с вендорами, подискутировать об инновационной модернизации сферы образования. Главные темы PROFIT Education Day 2025: ⚪️ Цифровые университеты, ИТ-инфраструктура вузов и цифровой образовательный процесс. ⚪️ EdTech. Новые технологии в образовании, технологические стартапы. ⚪️ Дистанционное образование. ⚪️ Применение искусственного интеллекта и машинного обучения в образовании. ⚪️ Расширенная реальность (AR) и виртуальная реальность (VR) в образовательном процессе. Почему важно посетить PROFIT Education Day 2025: ⚪️ Точка притяжения: профессиональное сообщество. ⚪️ Сок рынка: лучшие эксперты делятся своим опытом. ⚪️ Фокус на кейсы: практический опыт, лайфхаки, возможность пообщаться со спикерами. ⚪️ Максимальное погружение: день, наполненный инсайтами, и никакой «воды». 👉 Регистрируйтесь #партнерский_пост
6 601
📣 Ingress NGINX уходит на пенсию — официально
Вышла новость от SIG Network и Security Response Committee Kubernetes — Ingress NGINX официально уходит в отставку. Это не шутка — проект, который обрабатывал миллиарды запросов по всему миру — ВСЁ (после февраля 2026 года).
Kubernetes объявил о завершении поддержки Ingress NGINX — популярного контроллера для входящего трафика. С марта 2026 года — никаких обновлений, фиксов багов или патчей безопасности. Репозитории на GitHub станут read-only, но существующие установки продолжат работать (пока не сломаются).
Одна из причин в том, что Ingress NGINX был слишком гибкий — через аннотации можно вставить любой конфиг, что приводило к уязвимостям. И команда решила, что риски перевешивают пользу. Также экосистема эволюционирует: Kubernetes фокусируется на Gateway API как на современном стандарте, чтобы избежать таких "монстров".
Что делать теперь, если используете Ingress NGINX:
⚪️ Запланируйте миграцию до марта 2026. Текущие деплойменты не сломаются сразу, но без патчей риски вырастут.
⚪️ Выберите альтернативу: например, Gateway API — это официальный преемник Ingress. Альтернативы контроллерам Traefik, Istio, Envoy Gateway.
⚪️ Проверьте ваши CI/CD-пайплайны — обновите Helm-чарты и мониторинг.
@DevOpsKaz 😛
6 601
🔥 Структурируем риски в Jira
20 ноября в 17:00 (UTC+5) приглашаем на онлайн-вебинар Optimizing Risk Management with Jira. На вебинаре расскажут, как сделать риск-процессы понятными, прозрачными и полезными для команды.
Темы:
⚪️ Удобная структура рисков и корректная taxonomy
⚪️ Workflow, который помогает, а не усложняет
⚪️ Дашборды, показывающие угрозы заранее
⚪️ Автоматизация для своевременных действий
❗️ Вебинар на английском. Участие бесплатное по регистрации
👉 Регистрация
#партнерский_пост
6 601
🔥 Записи выступлений с Cloud Native Community Day
Провели первый митап в рамках инициативы Cloud Native на площадке нашего партнера Satbayev University — готовы поделиться докладами с вами.
👉 Смотреть записи докладов
По ссылке доклады:
⚪️ Илиев Тельман, Head of DevOps, Tele2/Atlel — «Istio и Envoy: от хаоса микросервисов к управляемому трафику»
⚪️ Дюсенов Сайран, Head of Infrastructure, «Aitu-Платёжные Решения» — «Сертификации Kubernetes от CNCF»
⚪️ Крамча Саин, DevOps Engineer, Core 24/7 — «Организация парка Kubernetes кластеров»
И не забудьте подписаться на YouTube-канал Cloud Native Kazakhstan — впереди много интересных событий.
Фотки можно посмотреть здесь.
@DevOpsKaz 😛
6 601
Cloupard Leaders Club №2 — IT-лидерлеріне арналған офлайн іс-шара 🐆
☁️ Кездесудің тақырыбы — «Қазақстандағы жергілікті бұлттағы шешімдер: практика, тәжірибе, мүмкіндіктер».
➡️ Формат — IT-компаниялар мен IT-бөлімшелерінің жетекшілеріне арналған жабық кездесу.
✅ Жарнама — минимум, тәжірибе мен басқарушылық инсайттар — максимум.
✅ Біз бұлттың инженерлік қырларын ғана емес, сонымен қатар стратегияны да талқылаймыз: өнім, GTM, экономика, масштабтау.
🎤 Спикерлер — серіктестер экожүйесінен және Cloupard командасынан көшбасшылар мен сарапшылар. Диалог, нақты кейстер, Q&A (сұрақ-жауап).
➡️ Үзілістерде — сапалы нетворкинг, дәмді жеңіл тағамдар және сыйлықтар ұтыс ойыны.
⏱️ 21 қараша, 10:00–17:00
📌 Most IT Hub, Алматы.
Қатысу — өтінім бойынша.
🔗 Сілтеме арқылы тіркеліңіз
🤍🤍🤍🤍🤍🤍🤍🤍🤍🤍
Cloupard Leaders Club №2 — офлайн-мероприятие для ИТ-лидеров 🐆
☁️ Тема встречи — «Решения в локальном облаке Казахстана: практика, опыт, возможности».
➡️Формат — закрытая встреча руководителей ИТ-компаний и ИТ-подразделений.
✅ Минимум «рекламы», максимум практики и управленческих инсайтов.
✅ Обсуждаем не только инженерные аспекты облака, но и стратегию: продукт, GTM, экономику, масштабирование.
🎤Спикеры — лидеры и эксперты из экосистемы партнёров и команды Cloupard. Диалог, живые кейсы, Q&A.
➡️ В перерывах — максимум качественного нетворкинга, вкусные угощения и розыгрыш призов.
⏱️ 21 ноября, 10:00–17:00
📌 Most IT Hub, Алматы.
Участие — по заявке.
🔗 Регистрируйтесь по ссылке
6 601
🔥 Как не сломать сервис в Kubernetes: роль PodDisruptionBudget
Иногда плановые работы в Kubernetes (обновления или смена нод) могут вывести сервис из строя. Чтобы этого избежать, используйте PodDisruptionBudget (PDB) — это объект, который ограничивает количество недоступных подов во время "добровольных" операций (voluntary disruptions).
PDB не спасёт от аппаратных сбоев, но сделает вашу инфраструктуру предсказуемой и устойчивой к изменениям. С PDB вы устанавливаете правила: сколько подов минимум должно работать (minAvailable) или сколько максимум может быть недоступно (maxUnavailable). Это напрямую влияет на SLO — если сервис должен быть доступен 99.9%, PDB помогает это гарантировать.
Как PDB работает на практике:
⚪️ Рассчитайте параметры: для сервиса с 5 подами
minAvailable=3 значит, что всегда должно работать минимум 3. maxUnavailable=1 — одновременно падает не больше 1 пода.
⚪️ Интегрируйте с другими инструментами: PDB работает с Horizontal Pod Autoscaler (HPA) — чтобы при масштабировании не нарушать лимиты. В CI/CD добавьте проверки PDB перед деплоем.
⚪️ Мониторьте нарушения: используйте Prometheus для алертов на eviction events — если PDB блокирует операцию, это сигнал пересмотреть настройки.
Когда внедрять PDB:
⚪️Для критичных сервисов (базы данных, API), чтобы избежать каскадных сбоев.
В продакшене: всегда, если используете rolling updates или node maintenance.
Совет: начните с minAvailable=1 для простых сервисов, чтобы не заблокировать операции.
PodDisruptionBudget — это не опция, а обязательный инструмент для любого продакшн-сервиса в Kubernetes.
В Core 24/7 мы помогаем внедрять такие практики, чтобы ваш бизнес не терял ни секунды.
@DevOpsKaz 😛6 601
👉 Вход в актовый зал Satbayev University — с ул. Сатпаева со стороны Нефтяного корпуса, через арку, где вас встретят волонтеры
6 601
🔥 Helm v4.0.0 только что вышел — через 6 лет после v3!
Релиз приурочен к 10-летию Helm, который стал стандартом для деплоя в Kubernetes, помогая командам упрощать CI/CD.
Ключевые обновления:
⚪️ Плагин-система на WebAssembly: полная переработка (HIP-0026) с Extism — плагины теперь sandboxed, кросс-платформенные, без рестарта. Post-renderers стали плагинами.
⚪️ Server-side Apply: нативная поддержка Kubernetes для лучшего разрешения конфликтов и управления полями.
⚪️ Chart v3: новая версия с обратной совместимостью v2, подготовка к экспериментальному API v3.
⚪️ Мониторинг ресурсов: интеграция kstatus watcher для ожидания статуса ресурсов.
⚪️ Кеширование чартов: локальное content-based caching для ускорения.
⚪️ Производительность и SDK: переход на slog (структурированное логирование), reproducible builds, улучшенный Go SDK с embeddable командами.
⚪️ Безопасность: улучшенная OCI-поддержка, валидация зависимостей.
⚠️ Breaking changes
Переименование флагов (--atomic → --rollback-on-failure), удаление deprecated (--no-update), строгий YAML-check. Существующие чарты v2 работают, но скрипты CI/CD нужно обновить.
v4 упрощает GitOps, повышает безопасность цепочки поставок и ускоряет деплой на 30%. Идеально для больших команд — меньше багов, больше автоматизации.@DevOpsKaz 😛
6 601
🔥 Третий спикер Cloud Native Community Day — Крамча Саин, DevOps Engineer, Core 24/7
Саин выступит с докладом на тему «Организация парка Kubernetes кластеров». В современном enterprise-ландшафте Kubernetes уже давно перестал быть единственным кластером в продакшене. В крупной организации их десятки, а иногда и сотни. Каждый кластер — это своя версия Kubernetes, свои CNI, CSI, Ingress-контроллеры, свои RBAC-политики и свои секреты. Ручное управление такой флотилией превращается в операционный кошмар.
Именно поэтому управление multi-cluster Kubernetes должно быть так же декларативным, как сами приложения, которые в нём работают.
Satbayev University
актовый зал
13 ноября в 16:00
❗️ ОТКРЫЛИ РЕГИСТРАЦИЮ ЗАНОВО
Для тех, кто не мог зарегаться из-за высокого спроса — теперь можете, открыли 50 дополнительных мест.
1. Переходим по ссылке и жмем Attend
2. Логинимся с почтой Google и заполняем данные
3. На последнем шаге выбираем continue with free plan
@DevOpsKaz 😛
6 601
🔥 Второй спикер Cloud Native Community Day — Дюсенов Сайран, Head of Infrastructure, «Aitu-Платёжные Решения»
Дюсенов Сайран — профессионал с 20-летним опытом в IT. С 2017 года успешно сдает профессиональные экзамены от IBM, Red Hat, CNCF и LPI как в офлайн, так и в онлайн формате. Работает с обширным стеком как в квазигосударственных, так и в международных компаниях. Имеет 5 действующих сертификатов Red Hat и 2 сертификата CNCF.
Дюсенов Сайран выступит с темой «Сертификации Kubernetes от CNCF» и расскажет обо всех нюансах, тонкостях и бенефитах: что даёт сертификация в СНГ-реалиях, какие есть экзаменационные лайфхаки, как готовиться к сертификации, а также roadmap на 25-26 года.
👉 Приходить послушать Сайрана бесплатно
Satbayev University актовый зал 13 ноября в 16:00@DevOpsKaz 😛
6 601
🔥 Кейс Sector Tree: оптимизация инфраструктуры и миграция в облако
Разработчик софта обратился к нам в Core 24/7 для миграции части сервисов в облако, а также за ускорением time-to-market своих разработок. Миграция была необходима, так как компания Sector Tree столкнулась с серьёзными проблемами в своём дата-центре, где частые перебои с электроэнергией приводили к отключению серверов.
Инфраструктура была построена на классических виртуальных машинах, что ограничивало масштабируемость и отказоустойчивость. Ключевые сервисы, включая мониторинг и приложения, страдали от сбоев, что угрожало операционной эффективности.
В результате наших работ критичные сервисы после миграции в облако больше не зависят от перебоев в дата-центре. А детальный мониторинг увеличивает прозрачность состояния инфраструктуры. Также сократилось время выпуска обновлений продукта на 30-40%.
👉 Узнайте, что мы делали, в новом кейсе
@DevOpsKaz 😛
6 601
🔥 Первый спикер Cloud Native Community Day — Илиев Тельман, Head of DevOps в Tele2/Atlel
Илиев Тельман — инженер с 15-летним опытом в IT-индустрии. Его экспертиза в Cloud Native технологиях подтверждена пятью сертификатами CNCF.
На митапе Тельман выступит с докладом «Istio и Envoy: От хаоса микросервисов к управляемому трафику».
Вы разберетесь, что такое Service Mesh и какие проблемы микросервисной архитектуры он решает. Получите сравнение популярных прокси-серверов и выясните, почему Envoy стал ключевым выбором для Data Plane. Посмотрите, как Istio позволяет контролировать и гибко управлять сетевым трафиком.
👉 Приходить послушать Тельмана бесплатно
Satbayev University актовый зал 13 ноября в 16:00@DevOpsKaz 😛
6 601
🔥 Chaos Engineering: как не бояться ломать прод и спать спокойно
Немного о Chaos Engineering простыми словами. Представьте, что ваш сервис — это машина. Вы не ждёте, пока она сломается на трассе, а специально дёргаете за провода, выключаете двигатель, прокалываете колесо — делаете всё это в безопасной среде, чтобы понять: «А что будет? Кто заметит? Как быстро починим?».
Цель: создать систему, которая защищена от случайностей, а если падает — восстанавливается сама за секунды. Звучит просто.На практике применить Chaos Engineering — непростая задача. Всегда есть страх «что-то сломать» и сложность технически реализовать. LitmusChaos MCP Server — инструмент, который упрощает реализацию Сhaos Engineering. Этот сервер на Go предоставляет полноценный интерфейс для управления экспериментами, инфраструктурами, средами и тестами на устойчивость. БЕЗ кода, YAML и конфигов. Всё взаимодействие — в чате с ИИ. Страх что-то сломать будет куда меньше. Что может: ⚪️ Удалять frontend pod’ы ⚪️ Изменять network latency ⚪️ Создавать http probe, которая проверяет API каждые 5 секунд ⚪️ Получать статистику о экспериментах и не только 👉 Посмотреть на GitHub @DevOpsKaz 😛
6 601
🔥 Satbayev University — генеральный партнер Cloud Native Community Day
Satbayev University актовый зал 13 ноября в 16:00 участие бесплатно после регистрацииВ стенах Satbayev University состоится митап — встреча экспертов и слушателей по темам DevOps-инженерии. Приглашенные спикеры: ⚪️ Илиев Тельман, Head of DevOps, Tele2/Atlel расскажет про «Istio и Envoy: от хаоса микросервисов к управляемому трафику» ⚪️ Дуйссенов Саиран, Head of Infrastructure, Aitu с темой доклада: «Сертификации Kubernetes от CNCF» ⚪️ Крамча Саин, DevOps Engineer, Core 24/7 выступит с темой «Организация парка Kubernetes кластеров» Такое сотрудничество позволит укрепить связь между бизнесом и студентами, которые в будущем станут специалистами. Главная задача Satbayev University — «обучение через научные исследования». Университет ведет широкую научную работу, а также мониторинг и анализ трендов развития науки по профильным направлениям. И этот митап отлично вписывается в их концепцию. @DevOpsKaz 😛
6 601
🔥 На Yandex Neuro Scale состоялось награждение лучших CTO стартапов Казахстана
Совместный проект Yandex Cloud и Digital Business — рейтинг технических директоров стартапов Казахстана — проводился с июня 2025 года. Итоги подвели на Yandex Neuro Scale 5 ноября.
Жюри выбрали топ-10 финалистов по пяти критериям:
🔹технические компетенции
🔹лидерские качества
🔹бизнес-мышление
🔹инновационность и адаптивность
🔹предыдущие достижения
Главного победителя выбирали открытым народным голосованием в телеграм-канале Digital Business.
Первое место занял Чингиз Кеншимов, CTO и сооснователь eKYC-платформы Verigram, предназначенной для биометрической идентификации и онбординга в финансовом секторе. Он получил грант в 10 млн тенге на облачную инфраструктуру в Yandex Cloud для дальнейшего развития продукта и сертификат на PR-поддержку от Digital Business.
Еще два финалиста выиграли специальные призы. Приз от Digital Business получил Даукен Сейтқали, CTO ARLAN BIOTECH, а от Yandex Cloud — Аян Уали, CTO SAU Super App.
Победителей наградили руководитель группы по работе со стартапами в Yandex Cloud Никита Ражев и Виталий Волянюк, основатель и директор Digital Business.
👉 Узнайте подробнее о проекте
6 601
🔥 Cloud Native Community Day — большой митап для всех, кто занимается Kubernetes, observability и платформенной инженерией.
3 причины, почему не стоит пропускать:
⚪️ Обмен реальным опытом — послушаете доклады тех, кто каждый день решает задачи в продакшене. Уйдете с готовыми решениями, которые можно внедрить у себя в компании и выделиться среди коллег. Будем говорить про сертификацию, service mesh и ArgoCD. Все то, что вы реально используете в проде.
⚪️ Укрепляем наше комьюнити и входим в мировую семью CNCF — 50+ единомышленников в одном зале: SRE, DevOps, платформенные инженеры, архитекторы. Это знакомства, которые превращаются в коллаборации, найм и совместные проекты. Официальное признание от CNCF — вы станете частью глобального сообщества 200 000+ специалистов.
⚪️ Бесплатный фуршет и подарки — голодными вас не оставим. А самым активным за лучшие вопросы вручим подарки. После докладов — неформальный нетворкинг и afterpaty, чтобы вы смогли обменяться контактами и просто развлечься.
❗️ Места ограничены — 100 человек.
👉 Регистрация
Ждём вас 13 ноября в 16:00!@DevOpsKaz 😛
6 601
🔥 Эволюция Observability — от версии 1.0 до 3.0
Представьте: ваш сервис упал в 3:00 ночи. Раньше вы бы открыли 5 вкладок, потратили час на корреляцию логов и метрик, а потом ещё час — на объяснение боссу, почему это стоило $50 000. Сегодня всё иначе.
За последние 5 лет observability прошла путь от «соберём хоть что-то» до «платим только за важное и сразу видим, где теряем деньги». В новой статье мы кратко разбираем эволюцию наблюдаемости:
⚪️ 1.0 — как команды тратили 2 часа в день на переключение между Kibana, Grafana и Jaeger.
⚪️ 2.0 — почему OpenTelemetry + Datadog решили проблему скорости, но создали новую — счёт за терабайты.
⚪️ 3.0 — как сервисы по типу Bitdrift и Honeycomb дают 1000× телеметрии за 0,01× стоимости, а AI сам находит аномалии до того, как клиенты заметят.
Статья на простом языке для новичков и тех, кто хочет кратко понять современную историю observability.
👉 Читайте в новой статье
@DevOpsKaz 😛
6 601
🔥 Предлагайте свой контент для публикации
На конференции DevOpsDays Almaty 25 у нас на стенде (Core 24/7) было много гостей — и многие хотели участвовать в жизни сообщества KazDevOps. Предлагали идеи по контенту, рубрикам, активностям.
По этой причине мы вновь напоминаем — предложить свой контент или идею может каждый.
Что это может быть за контент:
— Кейсы из вашей работы по администрированию, безопасности, DevOps, облакам и т.п.
— Новости, которые порадуют коллег
— Книги, фильмы и руководства — всё, что пригодится в обучении
— Ваш личный карьерный путь — такой, которым стоит поделиться
— То, о чем мы не подумали, но вам кажется это классным
Принимаем ваш контент в боте по ссылке здесь и ниже. Рассмотрим, опубликуем или свяжемся за уточнением — и обязательно укажем ваше авторство.
@DevOpsKaz 😛
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
