en
Feedback
Инжиниринг Данных

Инжиниринг Данных

Open in Telegram

Делюсь новостями из мира аналитики и карьерными советами. 15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG 🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com №5017813306 Реклама: https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce

Show more

📈 Analytical overview of Telegram channel Инжиниринг Данных

Channel Инжиниринг Данных (@rockyourdata) in the Russian language segment is an active participant. Currently, the community unites 23 868 subscribers, ranking 5 712 in the Technologies & Applications category and 28 089 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 23 868 subscribers.

According to the latest data from 10 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -21 over the last 30 days and by -2 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 23.26%. Within the first 24 hours after publication, content typically collects 11.91% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 5 552 views. Within the first day, a publication typically gains 2 844 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 37.
  • Thematic interests: Content is focused on key topics such as claude, postgres, databricks, aws, sql.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Делюсь новостями из мира аналитики и карьерными советами. 15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG 🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com №5017813306 Реклама: https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9...

Thanks to the high frequency of updates (latest data received on 11 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

23 868
Subscribers
-224 hours
-387 days
-2130 days
Attracting Subscribers
June '26
June '26
+54
in 2 channels
May '26
+253
in 1 channels
Get PRO
April '26
+286
in 4 channels
Get PRO
March '26
+367
in 2 channels
Get PRO
February '26
+345
in 6 channels
Get PRO
January '26
+331
in 10 channels
Get PRO
December '25
+199
in 4 channels
Get PRO
November '25
+282
in 7 channels
Get PRO
October '25
+346
in 6 channels
Get PRO
September '25
+206
in 6 channels
Get PRO
August '25
+312
in 8 channels
Get PRO
July '25
+322
in 6 channels
Get PRO
June '25
+417
in 7 channels
Get PRO
May '25
+266
in 4 channels
Get PRO
April '25
+335
in 6 channels
Get PRO
March '25
+516
in 8 channels
Get PRO
February '25
+402
in 8 channels
Get PRO
January '25
+448
in 5 channels
Get PRO
December '24
+544
in 8 channels
Get PRO
November '24
+545
in 9 channels
Get PRO
October '24
+459
in 9 channels
Get PRO
September '24
+4 451
in 7 channels
Get PRO
August '24
+1 309
in 2 channels
Get PRO
July '24
+299
in 5 channels
Get PRO
June '24
+1 114
in 1 channels
Get PRO
May '24
+356
in 4 channels
Get PRO
April '24
+417
in 6 channels
Get PRO
March '24
+460
in 5 channels
Get PRO
February '24
+598
in 1 channels
Get PRO
January '24
+396
in 2 channels
Get PRO
December '23
+372
in 2 channels
Get PRO
November '23
+369
in 3 channels
Get PRO
October '23
+247
in 2 channels
Get PRO
September '23
+317
in 0 channels
Get PRO
August '23
+364
in 0 channels
Get PRO
July '23
+483
in 0 channels
Get PRO
June '23
+293
in 0 channels
Get PRO
May '23
+751
in 0 channels
Get PRO
April '23
+511
in 0 channels
Get PRO
March '23
+389
in 0 channels
Get PRO
February '23
+368
in 0 channels
Get PRO
January '23
+355
in 0 channels
Get PRO
December '22
+317
in 0 channels
Get PRO
November '22
+443
in 0 channels
Get PRO
October '22
+378
in 0 channels
Get PRO
September '22
+473
in 0 channels
Get PRO
August '22
+506
in 0 channels
Get PRO
July '22
+396
in 0 channels
Get PRO
June '22
+557
in 0 channels
Get PRO
May '22
+451
in 0 channels
Get PRO
April '22
+469
in 0 channels
Get PRO
March '22
+404
in 0 channels
Get PRO
February '22
+462
in 0 channels
Get PRO
January '22
+446
in 0 channels
Get PRO
December '21
+391
in 0 channels
Get PRO
November '21
+424
in 0 channels
Get PRO
October '21
+1 081
in 0 channels
Get PRO
September '21
+644
in 0 channels
Get PRO
August '21
+712
in 0 channels
Get PRO
July '21
+947
in 0 channels
Get PRO
June '21
+349
in 0 channels
Get PRO
May '21
+519
in 0 channels
Get PRO
April '21
+557
in 0 channels
Get PRO
March '21
+378
in 0 channels
Get PRO
February '21
+526
in 0 channels
Get PRO
January '21
+411
in 0 channels
Get PRO
December '20
+5 506
in 0 channels
Date
Subscriber Growth
Mentions
Channels
11 June+3
10 June+4
09 June+4
08 June+3
07 June+4
06 June0
05 June+3
04 June+4
03 June+8
02 June+15
01 June+6
Channel Posts
📚 Вышел очень крепкий хэндбук по A/B-тестам — его подготовили в команде платформы Trisigma от Авито Тех. Обычно такие матери
📚 Вышел очень крепкий хэндбук по A/B-тестам — его подготовили в команде платформы Trisigma от Авито Тех. Обычно такие материалы уходят либо в сухую теорию, либо в абстрактные примеры. Здесь наоборот все завязано на реальных продуктовых кейсах и практических ошибках, с которыми сталкиваются команды в продакшне. Внутри не только базовые вещи про гипотезы и метрики, но и то, что часто забывают даже опытные специалисты: дисперсия, стандартная ошибка, распределения, чувствительность метрик, ложноположительные и ложноотрицательные результаты. И ко всему есть формулы, примеры и понятные объяснения. Отдельно разобраны: – классификация метрик (goal, proxy, guardrail, debug); – закон Кэмпбелла; – OEC; – атомарный дизайн метрик; – Central Limit Theorem без академической духоты. Полезно и тем, кто только входит в аналитику/продакт, и тем, кто уже работает с экспериментами, но хочет систематизировать знания или подготовиться к собеседованиям. Хэндбук бесплатный. Получить можно через бота. Да, там встроена подписка на канал, но контент у ребят действительно достойный. К тому же, команда Trisigma отдает его бесплатно.

2
Dagster и цены мы тут обсуждали в прошлом. Походу еще дороже стал. Полностью поддерживаю, если у вас с бюджетом напряг не исп
Dagster и цены мы тут обсуждали в прошлом. Походу еще дороже стал. Полностью поддерживаю, если у вас с бюджетом напряг не используйте Dagster. Airflow или AWS Step functions и AWS Batch (если надо совсем дешево и вы на AWS)
2 953
3
Очевидный факт - рост AI инженеров. Сейчас это уже не LLM researcher, и человек, который знает как работать с моделями, как и+2
Очевидный факт - рост AI инженеров. Сейчас это уже не LLM researcher, и человек, который знает как работать с моделями, как их выбирать, настраивать, проверять качество, и отслеживать стоимость. Сейчас отличное время войти в эту профессию и уже на месте разбираться как лучше это использовать.
2 984
4
Атака на корпоративного ИИ-ассистента: разбор уязвимостей в прямом эфире Большинство ИИ-систем с доступом к внутренним данным
Атака на корпоративного ИИ-ассистента: разбор уязвимостей в прямом эфире Большинство ИИ-систем с доступом к внутренним данным уязвимы. И проблема не в самом ИИ, а в том, что безопасность закладывают после запуска, а не до. 16 июня MWS AI (входит в МТС Web Services) покажут живое демо атаки на корпоративного ИИ-ассистента, подключенного к внутренним базам данных. Разберут конкретные векторы, слабые места архитектуры и что именно приводит к раскрытию лишнего контекста. Также в программе: • чек-лист вопросов перед выводом ИИ-решения в прод • рамка для оценки стоимости ИИ-инцидента • как выстроить взаимодействие между разработкой, ИБ и бизнесом Будет полезно ML-инженерам, архитекторам ИИ-систем и техническим лидерам, которые проектируют или внедряют решения с доступом к корпоративным данным. 🗓 16 июня, 16:00 мск → Зарегистрироваться
3 014
5
Сегодня прошла замечательная история. На моем любимом проекте в Technical Safety BC, где работают пенсионеры и полу пенсионеры (в прямом смысле ждут свою пенсию), где текущий дата инженер использует голосовые помощники, чтобы делать пайплайны в SSIS, потому что потерял зрение на старости лет - меня уволили одним днем, за то, что в проекте по миграции on-premises на AWS я сделал s3 bucket public. Хотел визуализировать excel табличку с прогрессом как сайт в тестовом AWS аккаунте. PS скорей всего они просто устали, что я слишком на них газовал и говорил, что они некомпетентные и ленивые бараны.
2 969
6
Закончилась экспедиция на sup. 5 дней и 4 ночи вокруг Vargas Island, это на острове Ванкувер со стороны Тихого океана. Погода+9
Закончилась экспедиция на sup. 5 дней и 4 ночи вокруг Vargas Island, это на острове Ванкувер со стороны Тихого океана. Погода была разная от +4 до +20, были и дожди и ветра. По расстоянию мы не очень много проплывали в день. В основ упор был на изучение навигации, карт, компаса, погоды и планирования. Группа была маленькая- 5 человек и 2 организатора. С одной стороны это очень дорогой тур, чтобы пожить в палатке и мерзнуть под дождем, с другой стороны он бесценный с точки зрения опыта и эмоцией. Следующим летом обязательно запишусь еще раз, но уже в другой локации.
3 158
7
+5
No text...
3 112
8
В наше время самый кайф это попасть в зону, где нет сети. Следующие 5 дней буду плавать на paddle board в тихом океане и ниче
В наше время самый кайф это попасть в зону, где нет сети. Следующие 5 дней буду плавать на paddle board в тихом океане и ничего делать🏄‍♂️
5 492
9
Наш любимый dbt стал еще лучше - встречайте dbt core v2 • dbt Core v2.0 — это новая open-source (Apache 2.0) основа, которая теперь написана на Rust вместо Python. По сути, dbt Labs взяли движок Fusion (который они разрабатывали отдельно), открыли его исходники и сделали новым фундаментом dbt Core. Сейчас в альфе. Fusion vs Core v2 — в чём разница? • dbt Core v2 — open-source Rust-движок, быстрый парсинг, новые артефакты. Это база. • dbt Fusion — надстройка над Core v2 с пониманием SQL, column-level lineage, богатым dev-опытом в VS Code. Это расширенная версия. Грубо говоря: Core v2 = фундамент, Fusion = фундамент + суперспособности. Что нового в Core v2: ⚡ Скорость — парсинг до 30x быстрее, чем в старом dbt Core на Python. Компиляция всего проекта в 2x быстрее. Это ощущается сразу. 📐 Строгая языковая спецификация — теперь нельзя случайно написать ⁠desciptin вместо ⁠description и не заметить. Чёткая схема языка = меньше глупых ошибок, стабильный интерфейс для интеграций. 📦 Parquet-артефакты — вместо огромных JSON-файлов. Можно напрямую запрашивать через DuckDB или любой AI-агент. Намного быстрее и удобнее для больших проектов. 📚 Новый локальный docs-опыт — полностью переработан, работает на новых артефактах, масштабируется на проекты любого размера. 🦀 Весь Rust-код теперь в репозитории dbt-core — то, что раньше было в dbt-fusion под лицензией ELv2, теперь открыто под Apache 2.0. Нужно ли мигрировать? Пока v2 в альфе. dbt Labs выпустили инструменты для миграции (⁠dbt-autofix), которые помогут подготовить проект. Python-версии dbt Core никуда не делись — они остаются доступными. Я пока мигрировать не собираюсь. Проблем в старых версий нет. В dbt core вообще проблем нет, поэтому никто не хочет покупать платную версию.
5 958
10
Почему ваша команда дата-инженеров всегда выглядит несчастной и выгоревшей: 1. Они тратят большую часть времени на переработк
Почему ваша команда дата-инженеров всегда выглядит несчастной и выгоревшей: 1. Они тратят большую часть времени на переработку плохо спроектированных таблиц в SQL 2. На них кричат, когда ломается чужой код 3. Никто не пишет тесты, но все ожидают, что они будут отлаживать сбои 4. Дежурство — это кошмар 5. Качество данных не ценится так, как функции с очевидным ROI 6. Сколько бы времени они ни тратили на сокращение облачных расходов — этого всегда мало 7. Им редко удаётся заниматься инновационной работой 8. Они — одна из наименее публично признаваемых инженерных команд (привет, Безопасность) 9. Это крайне сложная роль для замещения = долгое время с открытыми вакансиями 10. У них маленький бюджет для огромной и дорогостоящей проблемы 11. Они чаще всего первыми получают обвинения и последними — похвалу 12. Количество сервисных тикетов никогда не уменьшается 13. Плохое моделирование данных делает их жизнь радикально сложнее 14. «Больших побед» для празднования значительно меньше 15. Им не хватает контроля для внедрения лучших практик управления данными 16. Управление данными никогда не в приоритете… пока внезапно не становится им 17. Их редко привлекают, когда стартует новый крупный дата-проект… 18. …но в итоге именно им приходится разгребать весь беспорядок 19. Их редко уведомляют об изменениях в upstream-системах, вызывающих сбои пайплайнов 20. Никаких контрактов с поставщиками данных!
6 434
11
Сегодня был еще один собес. На входе 5 лет опыта. Задачка такая же - платформа на AWS. Кандидат прыгал с Postgres на Snowflak
Сегодня был еще один собес. На входе 5 лет опыта. Задачка такая же - платформа на AWS. Кандидат прыгал с Postgres на Snowflake и Databricks. Про dbt не слышал, Airflow мельком. 5 лет это реальный опыт. То есть можно работать годами и ничего не знать, а можно за 6 месяцев качнуться на Surfalytics или самому, построить несколько типовых решений и уже будете знать больше чем 90% кандидатов с 5-10 лет опыта. Причина вся даже, люди ленятся учиться и развиваться. Они думаю, что на работе им достаточно навыков и их потом возьмут на другую работу. В свободное время они гуляют и кайфуют. И это хорошо! Но лучше гулять и кайфовать в рабочее время🎃 Но для этого надо бы сначала качнуться как следуют, чтобы потом на “чиле, на раслабоне”🛌
5 915
12
Сегодня проводил собес по system design DE. У Кандидата было резюме на 10 страниц текста! Сами понимаете серьезные кандидат.+1
Сегодня проводил собес по system design DE. У Кандидата было резюме на 10 страниц текста! Сами понимаете серьезные кандидат. Я приложил задачку и результат. Чувак не в теме особо про dbt, Snowflake и тп. Прям как из нашего отечественного дата инжиниринга, но нет, он был из Индии и уже много лет работает дата инженером. Как я понял весь его опыт был про Spark Jobs на Hadoop. И в основном на этапе data ingestions. Нужно ли знать dbt и Snowflake всем? Нет не нужно. Но это, как бы, самое популярное на рынке и для общего развития неплохо бы знать в общих чертах, как и duckdb, и тп. Это называется grow mindset. Сейчас вообще можно ничего не знать, но работу делать. А если вы еще и понимаете, что делаете, то тогда работа приносит удовольствие. Идеально, когда вы понимаете и знаете, а ваша команда не знает и не понимает, как и ваш менеджер😁 PS я еще провожу собеседование на CTO и инженера по спутникам. Идея простоя, засунуть побольше AI и других вещей в спутник и отправить в космос, сложность, что пустой спутник отправить в космос стоит годовых инвестиций. И цены только растут.
5 836
13
Сегодня проводил собес по system design DE. У Кандидата было резюме на 10 страниц текста! Сами понимаете серьезные кандидат. Я приложил задачку и результат. Чувак не в теме особо про dbt, Snowflake и тп. Прям как из нашего отечественного дата инжиниринга, но нет, он был из Индии и уже много лет работает дата инженером. Как я понял весь его опыт был про Spark Jobs на Hadoop. И в основном на этапе data ingestions. Нужно ли знать dbt и Snowflake всем? Нет не нужно. Но это, как бы, самое популярное на рынке и для общего развития неплохо бы знать в общих чертах, как и duckdb, и тп. Это называется grow mindset. Сейчас вообще можно ничего не знать, но работу делать. А если вы еще и понимаете, что делаете, то тогда работа приносит удовольствие. Идеально, когда вы понимаете и знаете, а ваша команда не знает и не понимает, как и ваш менеджер😁 PS я еще провожу собеседование на CTO и инженера по спутникам. Идея простоя, засунуть побольше AI и других вещей в спутник и отправить в космос, сложность, что пустой спутник отправить в космос стоит годовых инвестиций. И цены только растут.
1
14
Послушал подкаст Data Engineering Central - там разговор с Джейкобом Мэтсоном, Developer Advocate из MotherDuck (это облачная версия DuckDB). 1. Индустрия устала от сложности После лет оверинжиниринга (Spark, Kafka, огромные кластеры) - маятник качнулся обратно. Всё больше задач решается на одной машине. DuckDB - яркий пример: просто, быстро, без инфраструктуры. 2. AI не убьёт дата-инженеров - наоборот Казалось бы, если AI генерирует SQL - зачем инженеры? Но тезис обратный: AI будет генерировать больше запросов, значит нужно больше людей, которые следят за качеством данных и моделями. Роль дата-инженера вырастет, а не исчезнет. 3. Data Modeling снова в моде Когда AI пишет запросы, он опирается на структуру данных. Если модель данных плохая - AI будет давать мусорные ответы. Хорошая модель данных становится критически важной. По сегодняшнему опыту, AI очень хорошо помогает в моделировании. Ведь моделирование - это набор правил, которым следуют разработчики. Если мы создадим правила для AI, добавим необходимый контекст, то получится очень эффективно. 4. DuckDB vs Spark Spark всё ещё нужен для реально больших данных. Но огромная часть "больших" задач на практике - это просто неоптимизированные маленькие задачи. DuckDB справляется с ними в разы проще и дешевле. Вывод: Простота побеждает. AI не заменяет инженеров, а меняет их фокус - от написания SQL к проектированию данных и контролю качества.
5 129
15
В cвой личный slack добавил себе Notion бота из Notion Calendar, который собирает все встречи и присылает мне список на завтр
В cвой личный slack добавил себе Notion бота из Notion Calendar, который собирает все встречи и присылает мне список на завтра и время во сколько вставать (за 15 минут до 1й встречи). Notion Calendar позволяет собрать все календари вместе, а если календарь закрыт, я вручную дублирую событие в личный календарь. Видно, что день прям busy, но это у меня такие обычные вторник, среда, четверг. Зато, в понедельник тихо, все еще отходят от выходных, а в пятницу все уже готовятся к выходным. Поэтому я уже воспринимаю вторник-четверг как данность, мне хоть в 3 раза больше митингов, справимся🎮 Сейчас столько классных штук, которые экономят время: • можно собрать все slackи в одном месте и агент будет все писать, что произошло • можно все почты подключить к агенту, тоже будет у вас summary. Но я пока по старинке! А как вы себе упростили рабочее время?
4 521
16
Поиск работы за рубежом часто выглядит как хаос: десятки джоб-бордов, LinkedIn, рефералы, противоречивые советы В итоге можно
Поиск работы за рубежом часто выглядит как хаос: десятки джоб-бордов, LinkedIn, рефералы, противоречивые советы В итоге можно месяцами что-то делать и не получать приглашений на интервью, а оффера ждать годами. Не потому что ты слабый кандидат — просто в твоем поиске нет системы. AgileFluent вот уже 5 лет помогают IT и Digital специалистам искать работу на международке: 800+ офферов в 32 странах, большая команда топовых экспертов и собственная платформа по откликам и нетворку. Ребята ведут крутой канал про международку, где делятся: ✔️ историями тех, кто переехал и зарабатывает в валюте, ✔️ разборами резюме и LinkedIn профилей, ✔️ гайдами, статьями и чек-листами, которые кратно упрощают поиски Если давно думаешь о работе за рубежом — это хороший момент начать. Подписывайся на ребят🙂 👉 Подписаться Реклама. ООО «Эджайл», ИНН 7810964334, erid:2VtzqxL664g
4 517
17
Если вам интересен соревновательный ML — у Яндекса скоро завершается регистрация на Yandex ML Challenge. Формат довольно прия
Если вам интересен соревновательный ML — у Яндекса скоро завершается регистрация на Yandex ML Challenge. Формат довольно приятный: длинный онлайн-тур без жёсткого тайминга на несколько часов. Можно спокойно подумать над решениями и потестить разные подходы. Из задач: — LLM / foundation models — CV — RL — оптимизация нейросетей Старт — 21 мая. На всё дают 11 дней и 40 сабмитов на каждую задачу. Топ-100 участников попадут в очный финал на Young Con в Москве. Победителю — 1 млн рублей, топ-15 получат устройства от Яндекса. В целом выглядит как хороший повод проверить себя на актуальных ML-задачах и посмотреть, что делают другие участники. Регистрация ещё открыта.
4 546
18
Собрал материал про AI workloads и видео карты на спутниках https://blog.playeronespace.com/p/brains-in-orbit-a-complete-guide Решил, что IoT спутниковая сеть это очень банально. Узнал про LEO PNT - gps на низкой орбите с точностью до см. Очень круто и дорого. А вот Edge AI интересный кейс и можно начать с небольшого, если просто сфокусироваться на сам спутник, который будет делать расчеты на борту.
4 626
19
Добавил пост про то, как и где учить Databricks https://blog.surfalytics.com/p/navigating-databricks-learning-a
5 392
20
Отличный аргумент, что AI не заменит нас! А вы умеете кушать готовить?👀
Отличный аргумент, что AI не заменит нас! А вы умеете кушать готовить?👀
6 499