DevOps&SRE Library
前往频道在 Telegram
Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://www.gosuslugi.ru/snet/67704b536aa9672b963777b3
显示更多📈 Telegram 频道 DevOps&SRE Library 的分析概览
频道 DevOps&SRE Library (@devopslibrary) 英语 语言赛道中的 是活跃参与者。目前社区聚集了 19 380 名订阅者,在 技术与应用 类别中位列第 6 957,并在 俄罗斯 地区排名第 34 916 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 19 380 名订阅者。
根据 09 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 161,过去 24 小时变化为 3,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 15.57%。内容发布后 24 小时内通常能获得 7.14% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 3 016 次浏览,首日通常累积 1 383 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 1。
- 主题关注点: 内容集中在 kubernete, cluster, infrastructure, storage, configuration 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Библиотека статей по теме DevOps и SRE.
Реклама: @ostinostin
Контент: @mxssl
РКН: https://www.gosuslugi.ru/snet/67704b536aa9672b963777b3”
凭借高频更新(最新数据采集于 10 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
19 380
订阅者
+324 小时
-67 天
+16130 天
帖子存档
19 380
Repost from Performance matters!
О бенчмаркинге, часть 1
Бенчмаркинг занимает значительную часть моей повседневной работы, поэтому важно понимать его основы, типы и ограничения.
По сути, это способ оценить производительность системы под нагрузкой.
Брендан Грегг в своё время ввёл наглядную терминологию:
* Passive Benchmarking
* Active Benchmarking
———
Passive Benchmarking простой и распространённый подход: настраиваешь окружение, запускаешь нагрузку, получаешь на выходе цифры и в дальнейшем ими руководствуешься.
Но это как раз тот случай, когда «просто» не значит «лучше».
Проблемы таких замеров:
* риск измерить не то, что планировалось изначально
* непонятно, что именно ограничивает производительность
* нельзя отличить систематическое отклонение от шума (об этом позже)
* остаемся без ответа, почему получены именно такие результаты
* сами бенчмарки могут содержать баги, что останется от нас скрыто
«Бенчмаркаешь A, на самом деле измеряешь B, а выводы делаешь о C». ©В итоге решения на основе таких данных могут оказаться даже хуже, чем если бы данных не было вовсе. ——— В противовес ему стоит Active Benchmarking (AB). Помимо настройки окружения требуется активное наблюдение за системой во время прогона. Задача понять: * то ли мы меряем, что планировали * что ограничивает производительность * согласуется ли наблюдаемое поведение с нашей моделью системы * что нужно изменить, чтобы улучшить результат AB способен дать более надёжный результат. Цена этого: более высокие требования к проведению эксперимента. Нужно не только уметь настроить окружение, но и верно интерпретировать наблюдаемое. Алгоритм: 1. Собрать данные о работе системы, тулинг в помощь (perf, bcc, iostat, bpftrace, tcpdump, ...) 2. Интерпретировать, как реагирует система (методологии USE, RED, off-CPU, TSA, ...) 3. Применять в цикле:
запустил
└─ пронаблюдал
└─ сформулировал гипотезу во что упираемся
└─ проверил в следующем прогоне
└─ повторил
Каждый пункт по отдельности даёт ограниченный эффект, зато вместе позволяет быстрее и увереннее продвигаться вперёд.
———
Вывод
Сырые цифры от Passive Benchmarking могут выглядеть правдоподобно и при этом вести к неверным и дорогим решениям.
Слепо доверяясь им, мы фактически надеемся, что угадали с сетапом с первого раза и учли все нюансы.
Не похоже на надёжную стратегию
Active Benchmarking напротив, позволяет избежать ловушки «бенчмаркаешь A, измеряешь B, делаешь выводы о C».
Цифры, полученные таким методом, поддаются объяснению, их можно оспорить и воспроизвести.
И на них уже можно опираться при принятии инженерных решений.
———
Что почитать
- Active Benchmarking
- CPU Benchmarks and Bad Tinder Dates
- Performance Methodologies
- Producing Wrong Data Without Doing Anything Obviously Wrong (тут может помочь заметка о чтении white paper)
To be continued...
———
Поддержать лайком на Linkedin.19 380
Keeping Your Security Model Intact When Running VMs in Kubernetes
https://medium.com/@dillon_b/migrating-vms-on-kubernetes-without-losing-nsx-level-security-1c4027396568
19 380
Стрим о защите контейнеров, который нельзя пропустить
Утёнок — для привлечения внимания.
28 мая в 11:00 на стриме разберём угрозы для контейнерных сред и где их ловить по пути от кода до кластера. Покажем, как новинки в Kaspersky Container Security меняют игру в защите контейнеров: от глубинного анализа образов с помощью ИИ до кастомных политик в пару кликов. За комплексный взгляд на тему отвечает специальный гость из платформы «Штурвал».
Чтобы не пропустить, регистрируйтесь.
19 380
We brought Skew Protection to your Kubernetes
We're excited to share a new experimental feature for Platformatic: Skew Protection in the Intelligent Command Center (ICC). This brings Vercel-style deployment safety to Kubernetes, letting you deploy without downtime and avoid version-mismatch problems.https://blog.platformatic.dev/skew-protection-for-kubernetes
19 380
DocumentDB on Kubernetes: Resilient, Highly Available Databases with Automatic Failover
https://itnext.io/documentdb-on-kubernetes-resilient-highly-available-databases-with-automatic-failover-74c1a3ec882e
19 380
Autoscaling Hid Our LLM Cost Regression (85% → 4% Cache Hit Rate)
Why we moved capacity engineering into CI and started gating on prefix-cache efficiencyhttps://medium.com/@nroan/autoscaling-hid-our-llm-cost-regression-85-4-cache-hit-rate-b4beab5df240
19 380
Why post-mortem action items die
https://incident.io/blog/why-post-mortem-action-items-die
19 380
The Incident Hero Trap
https://uptimelabs.io/articles/the-incident-hero-trap
19 380
What does using AI for post-mortems actually mean?
https://incident.io/blog/what-does-using-ai-for-post-mortems-actually-mean
19 380
Why LLMs Write Incorrect SQL (and What That Means for Your Database)
Most LLM-generated SQL doesn't fail. It runs and returns results, and that's exactly what makes it dangerous. The errors don't surface until they're already in your data.https://readyset.io/blog/why-llms-write-incorrect-sql-and-what-that-means-for-your-database
19 380
The Human Infrastructure: How Netflix Built the Operations Layer Behind Live at Scale
In the three years since our first Live show, Chris Rock: Selective Outrage, we have witnessed an incredible expansion of our live content slate and the live operations that support it. From modest beginnings of streaming just one show per month, we are now capable of streaming over nine shows in a single day, reaching tens of millions of concurrent members. This post pulls back the curtain on the Live Operations teams that enable this rapid scale.https://netflixtechblog.com/the-human-infrastructure-how-netflix-built-the-operations-layer-behind-live-at-scale-33e2a311c597
19 380
codeburn
CodeBurn tracks token usage, cost, and performance across 19 AI coding tools. It breaks down spending by task type, model, tool, project, and provider so you can see exactly where your budget goes.https://github.com/getagentseal/codeburn
19 380
openhare
openhare is an AI-powered, cross-platform desktop SQL client with multi-database support, built for everyday development, data analysis, and DBA management workflows.https://github.com/sjjian/openhare
19 380
eraser
Eraser helps Kubernetes admins remove a list of non-running images from all Kubernetes nodes in a cluster.https://github.com/eraser-dev/eraser
19 380
Finding zombies in our systems: A real-world story of CPU bottlenecks
https://medium.com/pinterest-engineering/finding-zombies-in-our-systems-a-real-world-story-of-cpu-bottlenecks-ea4722e552eb
19 380
Стартуем с Kubernetes без боли в Managed Kubernetes от MWS Cloud Platform.
27 мая в 16:00 Александр Курасов, технический владелец продукта в MWS Cloud Platform, покажет, как развернуть кластер за минуты, на вебинаре «Быстрый старт с Managed Kubernetes в облаке MWS».
Разберём архитектуру сервиса, его интеграцию с IAM, сетями и балансировщиками. Увидите, как управляемый сервис берёт на себя администрирование master-узлов и упрощает жизнь.
Будет интересно:
♦DevOps-инженерам, которые хотят упростить работу с Kubernetes
♦Backend-разработчикам, которым нужно быстро задеплоить сервис
♦Platform-инженерам, строящим cloud-native инфраструктуру
♦Техлидам и архитекторам, выбирающим Kubernetes в облаке
➡ Зарегистрироваться
19 380
I Don’t Care if AI Wrote the Code. You Own It.
SREcon Chair Heinrich Hartmann on why the age of AI-assisted engineering demands a radical return to design rigor.https://www.runllm.com/blog/i-dont-care-if-ai-wrote-the-code-you-own-it
19 380
Superficial Blamelessness
For many organizations, some form of blamelessness has become a more standard practice and blame-awareness has been gaining in popularity. However, there is an anti-pattern I have noticed as well, which I like to call superficial (or shallow) blamelessness that I think is important for people to be on the lookout for.https://resilienceinsoftware.org/news/11502437
19 380
Not all index scans are equal: How we cut query latency by over 99%
https://www.datadoghq.com/blog/detect-inefficient-index-scans-with-dbm
19 380
hunk
Hunk is a review-first terminal diff viewer for agent-authored changesets, built on OpenTUI and Pierre diffs.https://github.com/modem-dev/hunk
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
