Инжиниринг Данных
Делюсь новостями из мира аналитики и карьерными советами. 15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG 🛠️ dataengineer.ru | 🏄♂️ Surfalytics.com №5017813306 Реклама: https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Ko'proq ko'rsatish📈 Telegram kanali Инжиниринг Данных analitikasi
Инжиниринг Данных (@rockyourdata) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 23 870 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 5 658-o'rinni va Rossiya mintaqasida 27 950-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 23 870 obunachiga ega bo‘ldi.
25 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -41 ga, so‘nggi 24 soatda esa -4 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 20.31% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 11.89% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 4 848 marta ko‘riladi; birinchi sutkada odatda 2 839 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 36 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent claude, postgres, databricks, aws, sql kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Делюсь новостями из мира аналитики и карьерными советами.
15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG
🛠️ dataengineer.ru | 🏄♂️ Surfalytics.com
№5017813306
Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9...”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 26 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
🎯 Роль лидера — не контролировать, а разблокировать Его приоритеты: дать тебе возможность работать, помочь с аналитикой и поддержать твой карьерный рост. Он заходит в проект на старте, но как только видит, что ты взял ownership — отступает. Если начинает микроменеджить — ему можно прямо написать в Slack: «Слушай, я справлюсь, не нужно». И это будет воспринято нормально. 📡 Никаких сюрпризов — ни вверх, ни вниз Главный принцип: держи в курсе. Не нужно писать эссе — достаточно короткого сообщения в Slack. Но он никогда не должен узнавать о проблемах или рисках последним. Это работает в обе стороны. ✍️ Коммуникация: сначала письменно, потом голосом Формат по умолчанию — краткие буллеты. Полные предложения не нужны. Если переписка становится запутанной — переходим в Slack huddle. Любой апдейт строится по схеме: что случилось → почему это важно → что делаем дальше. 📋 Еженедельные рефлексии — обязательно Каждую неделю — короткий документ: достижения, проблемы, вызовы, кого хочется отметить. Не более 15 минут. Можно использовать AI. Зачем это нужно? Это конкретные доказательства твоей работы — для промоушена, для компенсации, для защиты в случае сокращений. 🧠 Для директоров и senior-менеджеров — отдельная планка Приходи с проблемой — приноси и решение. Хотя бы черновое. Просто «пожаловаться» — это не лидерство. Принимай решения самостоятельно там, где у тебя есть контекст и полномочия. Эскалируй осознанно — только если исчерпал варианты и у тебя есть рекомендация. Мне нравится такой подход: всё явно, без угадывания ожиданий.Но в целом это не помогло компании, за несколько месяцев акции упали в 5 раз и дальше падают. Не все выживают в AI гонке. На ближайшей встрече будем обсуждать как мигрировать 4 инстанса AWS Airflow на один GCP Composer.
c_H = w · t_fb / S_nm объясняет, почему здесь бывает жить: t_fb — сколько надо ждать результата, w зарплата эксперта, который проверяет, S_nm запас экспертизы в экономике. Длинный лаг умножается на дорогого эксперта, а делится на тающий запас экспертов. В пределе проверять некому, агенты летают без надзора
Q3 (нижний правый) — автоматизация дорогая, проверка дешёвая. Качественный user research и интервью с пользователями, ручной разбор отзывов и NPS с пониманием контекста, конкурентный анализ, подготовка слайдов для C-level с правильным месседжингом, разметка эджевых кейсов в данных. Зона временно живая, пока стрелка K_C на графике (рост компьюта) не сдвинет её содержимое влево, в Q1, и LLM в разбор отзывов и в классификацию уже зашли
Q4 (верхний правый) — автоматизация дорогая, проверка дорогая. Дизайн самой системы измерения продукта, то есть что считать North Star, перевод мутного запроса от CEO «надо увеличить engagement» в конкретные гипотезы и план измерений, дизайн экспериментальной программы на год с выбором guardrail-метрик, стратегические решения о приоритизации продуктовых направлений на данных плюс контексте, который нигде не записан
Погоди, а в чем тут новость? С джунами также ведь! Это база!
В целом я тоже так думал — замените агентов на джунов и суть же не изменится: джун делает Q1, мидл Q2, сеньор Q4, это карьерная лестница из любого учебника, какая там новизна вообще? Но есть три места, где аналогия агенты = джуны ломается, и из-за них статью, собственно, и написали:
1️⃣Verification не масштабируется, а execution масштабируется
Один сеньор мог проверять пару джунов в день, и количество джунов было ограничено физикой найма. Сегодня сеньор должен проверять выход агента, который генерирует в тысячи раз больше за тот же час. Execution капасити экспоненциальная, verify капасити линейная, упирается в одного человека. С джунами этой асимметрии не было, потому что джун тоже ограничен временем
2️⃣Codifier's curse
С джунами было так: сеньор обучает джуна, наращивает свой статус (становится ментором), джун через 5 лет становится мидлом, рынок экспертизы расширяется. С агентами: сеньор обучает модель, перекладывает свою интуицию в обучающие данные, и его собственная ценность падает. Аналога в карьерной лестнице нет, механизм работает в обратную сторонуМногие компании уже используют Apache Spark для обработки и трансформации данных, но часто только в привычных сценариях. Spark остаётся инструментом исключительно для Spark‑разработчиков: сложный стек и высокий порог входа мешают вовлекать в работу другие команды. В результате потенциал платформы используется лишь частично.На вебинаре 23 июня эксперты Cloud.ru покажут, как с помощью Spark Connect и сервиса Evolution Managed Spark сделать взаимодействие со Spark удобным для разных ролей. В программе:
▶️
Интерактивная разработка со Spark через локальную IDE и Spark Connect;
▶️
Анализ и визуализация данных в Jupyter Notebooks;
▶️
Построение ETL‑процессов в dbt на чистом SQL;
▶️
Сценарии использования Spark для разработчиков, аналитиков и специалистов Data Lakehouse;
▶️
Возможности Evolution Managed Spark для интерактивной работы с данными.➡️ Бонус: практическая часть с демонстрацией сценариев интерактивной работы с Apache Spark 👉 Зарегистрироваться 👈
Статья рассказывает о подходе Snowflake к интеграции Apache Spark в свою экосистему. Вот ключевые моменты: • Главный герой — Holden Karau, Principal Software Engineer в Snowflake и коммиттер Apache Spark. • Цель Snowflake — адаптировать Spark API для улучшения возможностей дата-инженерии и создания более целостного опыта для пользователей. • Open Source подход — компания активно участвует в разработке открытых проектов, таких как Apache Spark и Apache Iceberg, что помогает лучше соответствовать потребностям клиентов. • Культура сотрудничества — Karau подчёркивает важность вклада в open source ради общего блага, а не личной выгоды, и делится опытом работы в открытых сообществах. • Если коротко: статья о том, как Snowflake строит интеграцию с Apache Spark через активное участие в open source разработке, а не просто использует готовые решения.Раньше у Snowflake был фокус на свой собственный фреймворк - Snowpark
Snowflake создал Snowpark — свой собственный developer API (Python, Scala, Java) с DataFrame-подобным синтаксисом, похожим на Spark. Но это не Spark — весь код выполняется внутри движка Snowflake, никакого Spark-кластера не нужно. По сути, Snowflake пытался предложить альтернативу Spark, не требующую внешней инфраструктуры.Возможно из Spark не сработал, и они решили топить за оригинальный Spark.
В Apache Spark 3.4 появился Spark Connect — архитектура с разделением клиента и кластера. Snowflake воспользовался этим, чтобы сделать Snowpark Connect for Spark: теперь можно писать настоящий PySpark-код, а выполняться он будет на движке Snowflake — без Spark-кластера. Это уже настоящий Apache Spark API, а не собственный аналог.
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
