DataEng
رفتن به کانال در Telegram
Data Engineering & Distributed Systems Contact @adilkhash
نمایش بیشتر4 401
مشترکین
-124 ساعت
-17 روز
+1230 روز
آرشیو پست ها
4 401
Отличная статья про уровни изоляций транзакций на примере популярной базы данных PostgreSQL: https://www.thenile.dev/blog/transaction-isolation-postgres
4 401
Airflow 2.8
Вышла новая версия Apache Airflow — 2.8. В ней, как ни странно, очень много новых плюшек, включая ObjectStore API, улучшенный UI и многое другое. Более подробно можно почитать здесь: https://bit.ly/41uLBQP
4 401
Netflix опубликовал доклады с очередного митапа про дата инжиниринг:
— Media Data for ML Studio Creative Production
— Start Stop Continue for optimizing complex ETL jobs
— Psyberg, An Incremental ETL Framework Using Iceberg
— Knowledge Management - Leveraging Institutional Data
— Building Reliable Data Pipelines
— Streaming SQL on Data Mesh
— Data Processing Patterns
— The Netflix Data Engineering Stack
4 401
Аналитик инструментов сборки и репозитория
Yandex Cloud
Москва, Санкт-Петербург, Новосибирск
Наша команда занимается развитием экосистемы инструментов монорепозитория Яндекса. Каждую неделю 8 тысяч разработчиков делают более 100 тысяч коммитов в наш монорепозиторий, пользуются нашей системой сборки более 5 млн раз, используют плагины для среды разработки и многое другое.
Наша служба постоянно работает над тем, чтобы делать системы удобнее, надёжнее, быстрее и понятнее. Мы ищем опытного аналитика, который поможет разработать систему метрик для наших продуктов для разработчиков и внедрить A/B-эксперименты, найдёт пути улучшения систем.
Какие задачи вас ждут
- Разрабатывать систему метрик качества и скорости для инструментов сборки, тестирования и репозитория
- Проводить сквозную аналитику наших инструментов
- Анализировать и улучшать продуктовые метрики наших систем
- Разрабатывать метрики разладки — уметь отслеживать, что именно с релизом пошло не так
- Внедрять A/B-тестирование в наши продукты
- Помогать строить хранилища данных репозитория и смежных систем для разработки метрик личной и командной активности и производительности
Мы ждём, что вы
- Работали продуктовым аналитиком не менее трёх лет
- Хорошо знаете Python и SQL
- Работали с BI-системами (DataLens, Tableau или PowerBI), умеете визуализировать данные
- Знаете математическую статистику и теорию вероятностей
- Готовы погружаться в специфику инструментов разработки и тесно общаться с разработчиками
- Умеете извлекать инсайты из данных и предлагать гипотезы по улучшению продукта
- Проводили A/B-эксперименты и анализировали их результаты
- Самостоятельны и не боитесь нестандартных задач
Откликнуться
Контакт в тг @oksidgi
4 401
Случайно наткнулся на предстоящий вебинар от Яндекс.Облака про их сервис Managed Apache Airflow: https://www.youtube.com/watch?v=gf-c4WkRJ7Q
Возможно вам будет интересно.
4 401
Как работать с данными в 2024 году? Узнайте на VK Data Meetup!
VK Data Meetup — серия событий для дата-инженеров, разработчиков, администраторов о практиках работы с данными на разных уровнях.
Митап 14 декабря посвящен Databases & Storage. Обсудим тренды наступающего 2024 года, разберем особенности реализации масштабных проектов миграции и трансформации хранилищ и баз данных.
⏰ 14.12.2023, 14:30 МСК
⚡️ Регистрация: https://bit.ly/46XUfIR
В программе
🔹 Тренды хранения данных, актуальные в 2024 году.
🔹 Миграция хранилища на Greenplum с сохранением уровня SLA.
🔹 Разделение слоев Compute & Storage в Hadoop.
🔹 Перенос большого Hadoop-кластера с bare metal на самописную оркестрацию One-cloud.
Приглашаем дата-инженеров, специалистов по DWH, администраторов, архитекторов и разработчиков.
Регистрация: https://bit.ly/46XUfIR
4 401
Tech predictions for 2024 and beyond | All Things Distributed
https://www.allthingsdistributed.com/2023/11/tech-predictions-for-2024-and-beyond.html
4 401
«Иннотех» запускает самый амбициозный проект российского финтеха и собирает под него ИТ-команду
Что будем создавать? Проект государственного масштаба — автоматизированную банковскую систему (АБС) для России. Это будет уникальная для российского рынка core banking платформа на современном технологическом стеке и микросервисной архитектуре.
Кто нам нужен?
• Java-разработчики;
• аналитики;
• специалисты DevOps;
• тестировщики;
• и не только.
Что мы предлагаем? Сложнейшие задачи для роста hard-скилов, возможность работать удаленно, ДМС и прочие бонусы.
Не упусти шанс войти в финтех-историю — жми «Присоединяйся к команде» и получи быстрый оффер.
Реклама. Информация о рекламодателе
4 401
Вторая часть статьи про развёртку Apache Airflow в Kubernetes: https://habr.com/ru/articles/774924/
4 401
На AWS появилась новая сертификация AWS Certified Data Engineer – Associate: https://aws.amazon.com/ru/certification/certified-data-engineer-associate/
4 401
Туда же, но только про Generative AI: https://microsoft.github.io/generative-ai-for-beginners/#/
4 401
Машинное обучение для начинающих
Классный бесплатный курс о машинном обучении от Microsoft: https://bit.ly/3MQmyl1
4 401
Привет от онлайн-конференции для техлидов и архитекторов Podlodka Techlead Crew!
⚙️ Масштабировать сложную архитектуру по всем правилам — задачка нетривиальная. Разбираем тренды и новшества, учимся справляться с проблемами. Готовы раскрыть свежие подробности сезона, который стартует 13 ноября:
💎 Улучшим архитектуру приложения с помощью CQRS. Объясним, как сделать взаимодействие между сервисами надёжным и консистентным, повысить масштабируемость и поддерживаемость системы.
💎 Узнаем, как решить проблемы хранения и масштабирования данных в транзакционно-аналитических системах, например, YDB. Эти системы способны одновременно работать с OLTP и OLAP-нагрузками.
💎 Рассмотрим, как развивать уже существующую архитектуру. Это будет доклад Владимира Иванова из Bolt про возможности, ограничения и способы избежать «бутылочных горлышек».
💎 Обсудим эволюцию технических метрик в контексте роста команд, компании, продукта и кода.
🤑 Промокод на скидку 500 руб: DataEng
Билеты и описание этих и других сессий на сайте: https://podlodka.io/techcrew
4 401
На Хабре вышла статья про Airflow в Kubernetes. Статья мне понравилась, целевая аудитория это новички в кубах, которые хотят развернуть Airflow. Сам я такой деплой не использую, но мне было полезно знать как оно там работает. Напомню, что у Airflow есть официальный helm chart: https://airflow.apache.org/docs/helm-chart/stable/index.html, если вдруг вы решите копнуть эту тему чуть глубже.
4 401
Ты системный аналитик? Прокачайся до уровня Middle с «Иннотех»!
Группа компаний «Иннотех» запускает новый поток технического обучения для системных аналитиков с опытом работы с возможностью дальнейшего трудоустройства в «Иннотех»
Во время бесплатного обучения в течение 6 недель участников ждет:
🔹 теория и практика от специалистов ведущей ИТ-компании,
🔹 обучение на реальных кейсах «Иннотеха»
🔹 индивидуальная обратная связь по каждому заданию,
🔹 обмен опытом и живое общение с преподавателями
Занятия будут проходить по вечерам с 18:00 до 19:30 в понедельник и четверг. Всего 12 заданий, на каждое из которых понадобится около 2 часов.
🌟 Как попасть на программу?
До 27 октября заполняйте анкету по ссылке и проходите входное тестирование. Количество мест ограничено! Старт обучения — 30 октября.
Лучших участников программы пригласят на работу в команду ГК «Иннотех»!
Реклама. Рекламодатель ООО «ГК «Иннотех» ». erid: Kra23xtUN
4 401
Человек на 60% состоит из воды, а Тинькофф на 100% из масштабных ИТ-задач и ежедневных вызовов
Если ты опытный ИТ-спец, этот вызов для тебя. А решение бытовых забот берем на себя: от ультра расширенной медстраховки и юридической поддержки до компенсации питания, спорта и дополнительного обучения.
Выбрать вакансию и стать частью ИТ-команды можно тут:
https://u.tinkoff.ru/itcareer
АО «Тинькофф Банк», ИНН 7710140679
4 401
Курс по соревновательному Data Science👨💻
🏆 Хочешь покорить Kaggle и научиться выигрывать соревнования по анализу данных? Тогда курс "Введение в соревновательный Data Science" - это именно то, что тебе нужно!
🎯 В отличие от большинства курсов по машинному обучению, этот сконцентрирован на практике. Поэтому на нем будет более 200 практических заданий, интервью с Kaggle Grand Masters и, конечно же, внутренние соревнования для отработки техник.
⚡️В программе курса тебя ждет:
* Продвинутая работа с pandas и numpy
* Генерация, визуализация и фильтрация признаков
* Модуль про SOTA градиентные бустинги и то как их тюнить
и еще 6 других блоков.
🚀 Также, ребята проводят еженедельные открытые вебинары, на которых разбирают решения победителей с чемпионатов и делают обзоры предстоящих соревнование.
🔗 Подписывайся на их телеграмм канал, там они делятся полезным контентом, рассказывают про курс и анонсят новые стримы.
4 401
Релиз Python 3.12
Релиз преимущественно связан с повышением производительности, в среднем улучшения около 5%. Из значительных фич это появление отдельного GIL на т.н. субинтерпретаторы. Эта фича пока доступна только в С API, а с версии Python 3.13 будет доступна и в Python API.
Подробнее о релизе: https://pythoninsider.blogspot.com/2023/10/python-3120-final-now-available.html
4 401
PyCon PT 2023
День богат на новые доклады. Сейчас появились видео с прошедшей конфы PyCon Portugal 2023: https://bit.ly/3PYOHY7
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
