es
Feedback
DataEng

DataEng

Ir al canal en Telegram

Data Engineering & Distributed Systems Contact @adilkhash

Mostrar más
4 402
Suscriptores
-724 horas
-87 días
+630 días
Archivo de publicaciones
DataEng
4 401
Планировал написать про кастомный бэкенд для XCom в Airflow, а ребята из Astronomer уже это сделали: https://www.astronomer.io/guides/custom-xcom-backends

DataEng
4 401
Бесплатный вебинар «Как запустить проект в Kubernetes за 60 минут» от Mail․ru Cloud Solutions Kubernetes — сложная для внедре
Бесплатный вебинар «Как запустить проект в Kubernetes за 60 минут» от Mail․ru Cloud Solutions Kubernetes — сложная для внедрения технология, если запускать ее самостоятельно, преодолевая все подводные камни и неочевидные препятствия. Специалисты MCS помогут вам подготовиться к возможным трудностям. На вебинаре от Mail․ru Cloud Solutions 29 апреля вы узнаете, как быстро задеплоить проект в Kubernetes за 60 минут, как справиться со всеми сложностями и настроить автоматизированный конвейер разработки приложения. По итогам вебинара вы получите готовый репозиторий в GitHub и сможете самостоятельно повторить все действия, которые будут продемонстрированы спикером в рамках вебинара. Мероприятие пройдет в четверг, 29 апреля, онлайн. Начало в 17:00 по Москве. Регистрация обязательна: https://vk.cc/c1ejXC

DataEng
4 401
Data Engineering Digest Коллеги, сегодня мы хотим анонсировать наш новый проект: Data Engineering Digest Мы создаем развиваемый сообществом digest интересных материалов по теме Data Engineering'а. Наш пилотный выпуск можно посмотреть здесь: https://digest.deordie.org Все мы с вами читаем статьи, смотрим видео с конференций, и находим массу полезного в сети. Однако, не все материалы одинаково полезны. При поддержке сообщества мы решили отбирать самое интересное и публиковать в виде дайджеста. Нам нужна ваша поддержка. Прямо сейчас можно стать контрибьютером. Приходите в наш issue tracker: https://github.com/deordie/deordie-digest/issues и добавляйте статьи, которые вам показались интересными. Обязательно добавьте 1-2 предложения, что вы вынесли интересного из этой статьи. Также вы можете проголосовать за понравившиеся вам статьи (+1), самые интересные мы будем публиковать в следующих выпусках.

DataEng
4 401
Вышел релиз Apache Airflow 2.0.2: https://github.com/apache/airflow/releases/tag/2.0.2 Пофикшено немало багов, тем кто задумывается об апгрейде на 2-ю версию инструмента уже можно начинать пробовать это делать.

DataEng
4 401

DataEng
4 401
Про структуру B-tree в PostgreSQL: https://www.youtube.com/watch?v=n5-xEEQFqPY

DataEng
4 401
Apache Software Foundation закрывает 13 Hadoop-related проектов: https://www.zdnet.com/article/apache-software-foundation-retires-slew-of-hadoop-related-projects/ Среди них: - Apex - Chukwa - Crunch - Eagle - Falcon - Hama - Lens - Marmotta - Metron - PredictionIO - Sentry - Tajo - Twill Я правда ни одним из этих проектов никогда не пользовался, но может ли это быть сигналом о том, что эпоха Hadoop близится к концу?

DataEng
4 401
Лучшие практики использования SQL по версии Metabase. Некоторые советы действительно ценные. Из того, что реально встречалось на практике особенно выделил бы один, так как в свое время удалось существенно оптимизировать время выполнения запроса: Prefer EXISTS to IN If you just need to verify the existence of a value in a table, prefer EXISTS to IN, as the EXISTS process exits as soon as it finds the search value, whereas IN will scan the entire table. IN should be used for finding values in lists. Metabase довольно интересный инструмент, на одном из проектов используем его, надо бы записать видео в продолжение Гайда по BI. Если у кого-то есть время и интерес поисследовать Metabase, а также записать видео, пишите мне в DM: @valiotti.

DataEng
4 401
Про хранимые процедуры в Amazon Redshift: https://www.missioncloud.com/blog/get-started-with-amazon-redshift-stored-procedures

DataEng
4 401
Про Streams в Redis за 10 минут: https://www.youtube.com/watch?v=7cvyluza00Q

DataEng
4 401
Видосы с прошедшего митапа DE or DIE #6: — Delta Lake — table format for large scale storage and analytics: https://www.youtube.com/watch?v=znVE6fpQqAU — Love to Frankenstein’s monster: Kotlin for Apache Spark: https://www.youtube.com/watch?v=sYTE-gICPuA

DataEng
4 401
В Казахстане компания Beeline организует бесплатную конференцию — BeeTech CONF: https://beetech.kz/conf Она пройдёт завтра, начало в 8 утра по Москве. В программе есть несколько интересных докладов для вас: Поток Big Data: — Как нам живется с Apache Airflow, доклад от местной команды разработки Beeline Kazakhstan — Строим собственную платформу данных: от отчётов и триггеров до сложных пайплайнов, от Samokat.ru Регистрация по ссылке: https://beetech.kz/conf

DataEng
4 401
Про data engineering для тех, кто не в теме: https://www.youtube.com/watch?v=qWru-b6m030 Классное вводное видео.

DataEng
4 401
Всем салют! 🤝 А вот и обещанная статья про TaskFlow API, который появился во второй версии Airflow: https://bit.ly/39lsHSK Кажется получилось неплохо, в заметке есть небольшой практический пример + сравнение old-style и нового стиля написания PythonOperator'ов. Код с примерами лежит как всегда у меня в репе: https://github.com/adilkhash/airflow-taskflow-api-examples Приветствуется конструктивная критика и пожелания 🙏 Скоро будет продолжение про кастомный бэкенд для XCom.

DataEng
4 401
В подкасте Data Engineering Podcast вышел эпизод с инженерами DoorDash про их Data-платформу: https://www.dataengineeringpodcast.com/doordash-data-platform-episode-176/

DataEng
4 401
⚠ Ребят, все кто оплачивал курс и у кого зависает окно после оплаты (и деньги с карты были сняты) — не беспокойтесь, у Qiwi сейчас сильные задержки с зачислением средств. Уведомления приходят в течение 5-6 часов после оплаты. Напишите мне в личку или на почту, я вручную открою доступ в этом случае.

DataEng
4 401
Привет! Всем, кто оставлял заявку на ранний доступ к курсу Apache Airflow, только что ушло письмо со скидкой и инструкцией как её активировать. Пожалуйста, проверьте ваш почтовый ящик, оставленный в Гугл-форме.