ar
Feedback
DataEng

DataEng

الذهاب إلى القناة على Telegram

Data Engineering & Distributed Systems Contact @adilkhash

إظهار المزيد
4 402
المشتركون
-724 ساعات
-87 أيام
+630 أيام
أرشيف المشاركات
DataEng
4 401
Серия видео про новшества в Airflow 2.0: https://bit.ly/395ib2C

DataEng
4 401
Netflix создал еще одно решение - Бульдозер, для экспорта данных из хранилища данных в NoSQL. https://netflixtechblog.com/bulldozer-batch-data-moving-from-data-warehouse-to-online-key-value-stores-41bac13863f8

DataEng
4 401
Я чуть выше публиковал серию лекций про распределённые системы от Мартина Клепмана, а вот недавно появился пост у него в блоге: https://martin.kleppmann.com/2020/11/18/distributed-systems-and-elliptic-curves.html

DataEng
4 401
Нашел интересный проект от Apache (пока на стадии инкубатора) — Apache Liminal: http://liminal.incubator.apache.org/ Платформа для оркестрации машинного обучения. Насколько понял, под капотом используется Apache Airflow.

DataEng
4 401
Some important updates from #AWS : ✅ Amazon Kinesis Data Streams enables data stream retention up to one year. ✅ Now you can export your Amazon DynamoDB table data to your data lake in Amazon S3 to perform analytics at any scale. ✅ Amazon Redshift now supports modifying column compression encodings to optimize storage utilization and query performance ✅ Amazon Athena announces availability of engine version 2

DataEng
4 401
Про разницу между OLTP и OLAP: https://www.analyticsvidhya.com/blog/2020/11/oltp-vs-olap/

DataEng
4 401
Набор AWS воркшопов: https://www.workshops.aws/

DataEng
4 401
A comparison of data version control tools. https://dagshub.com/blog/data-version-control-tools/

DataEng
4 401
Лекции про распределенные системы: https://www.youtube.com/playlist?list=PLeKd45zvjcDFUEv_ohr_HdUFe97RItdiB

DataEng
4 401
​​Собираетесь освоить специальность Data Engineer? Начните свой профессиональный путь уже 24 ноября на демо-занятии «Знакомство с Greenplum». Вместе с преподавателем Василием Сушко вы рассмотрите класс MPP-баз на примере базы Greenplum и построите небольшое хранилище данных на основе этой базы. Вы узнаете, что такое аналитические базы и для чего они нужны, чем DWH отличается от просто большой базы, что такое Greenplum. Демо-урок — возможность попробовать онлайн-курс «Data Engineer» и познакомиться с преподавателем. Для регистрации на занятие пройдите вступительный тест https://otus.pw/uRdz/

DataEng
4 401
Доброе утро! Четвертый день главной аналитической конференции начнется через 30 минут. Сегодня говорим про Data-инжиниринг и
Доброе утро! Четвертый день главной аналитической конференции начнется через 30 минут. Сегодня говорим про Data-инжиниринг и отчетность. Спикерам разрешили материться, будет интересно 😁 FREE: matemarketing.ru FULL: https://lms.matemarketing.ru @internetanalytics

DataEng
4 401
​​Два экспресс-курса для начинающих админов! Хочется поскорее в DevOps? Вам нужен «IaC Ansible» от Express42 и OTUS. 5 дней онлайн-занятий, и вы сможете одной командой выкатывать код, автоматизировать запуск сервера, использовать Ansible для работы с данными и многое другое. Практика пройдет в облаке GCP. Старт 23 ноября. Оставьте заявку, чтобы занять место по спец.цене https://otus.pw/FSqp/ Хотите оптимизировать процессы логирования? Тогда для вас быстрый онлайн-курс«ELK». За 2 дня онлайн-практики вы: — Разберетесь в устройстве Elastic stack и его отличиях от Graylog и других решений, — Овладеете базовым практическим опытом по использованию системы логирования в типовом проекте. Старт 26 ноября. Оставьте заявку, чтобы успеть занять место спец.цене https://otus.pw/kUOE/

DataEng
4 401

DataEng
4 401
На платформе Udemy можно бесплатно зарегистрироваться на курс Google Associate Cloud Engineer 2020: https://www.udemy.com/course/google-certified-associate-cloud-engineer-2019-prep-course/

DataEng
4 401
Отличный материал про сравнение самых популярных облачных хранили: BigQuery, Amazon Redshift и Snowflake — https://poplindata.com/data-warehouses/2020-database-showdown-bigquery-vs-redshift-vs-snowflake/

DataEng
4 401
Для Redshift выпущен коннектор под Python: https://github.com/aws/amazon-redshift-python-driver

DataEng
4 401
Внезапно! От издательства Packt Publishing вышла книга Data Engineering with Python: https://www.packtpub.com/product/data-engineering-with-python/9781839214189 В книге акцент уделён построению дата пайплайнов на Apache Airflow и Apache NiFi. Также есть главы, посвященные Kafka и Spark.