Data Analysis / Big Data
رفتن به کانال در Telegram
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels
نمایش بیشتر2 742
مشترکین
-224 ساعت
-27 روز
+130 روز
آرشیو پست ها
Enhance analytics with Google Trends data using AWS Glue, Amazon Athena, and Amazon QuickSight
Read: https://aws.amazon.com/blogs/big-data/enhance-analytics-with-google-trends-data-using-aws-glue-amazon-athena-and-amazon-quicksight/
Scale Amazon Redshift to meet high throughput query requirements
Read: https://aws.amazon.com/blogs/big-data/scale-amazon-redshift-to-meet-high-throughput-query-requirements/
Управление предпочтениями людей через социальные сети
Читать: https://habr.com/ru/post/319596/
All else is never equal
Read: https://junkcharts.typepad.com/numbersruleyourworld/2022/04/all-else-is-never-equal.html
Умный город Ташкент: как Visiology BI и Геоинтеллект помогли создать современный ситуационный центр
Привет, Хабр! Меня зовут Ахрор, и я занимаю должность управляющего проектами в Департаменте Цифрового Развития Ташкента. Сегодня я хочу рассказать вам о том, как мы создавали систему управления Smart City для столицы Узбекистана на базе российских решений — ПО для бизнес-аналитики и визуализации Visiology и платформы “Геоинтеллект”. Новая система объединила более 60 ведомств и стала основой для работы диспетчерского ситуационного центра. В этом посте я подробно расскажу о том, как создавалась и проектировалась платформа, а также о том, какие возможности Геоинтеллекта и Visiology мы использовали.
Читать: https://habr.com/ru/post/662019/
Четыре хитрости в работе с пайплайнами данных, о которых знают не все
Dust-n-Rust by Spiritofdarkness
Команда разработки Cloud Big Data от VK Cloud Solution перевела статью с советами, которые касаются общих понятий работы с пайплайнами. Неважно, какую систему управления рабочими процессами вы используете, эти идеи можно применять везде. Сам автор пользуется Apache Airflow и приводит примеры кода на ее основе.
Эта статья будет полезна не только дата-инженерам, но и дата-сайентистам, так как хороший дата-сайентист тоже понимает принципы работы пайплайнов данных.
Читать: https://habr.com/ru/post/659389/
Amazon Redshift continues its price-performance leadership
Read: https://aws.amazon.com/blogs/big-data/amazon-redshift-continues-its-price-performance-leadership/
Automate notifications on Slack for Amazon Redshift query monitoring rule violations
Read: https://aws.amazon.com/blogs/big-data/automate-notifications-on-slack-for-amazon-redshift-query-monitoring-rule-violation/
Share data securely across Regions using Amazon Redshift data sharing
Read: https://aws.amazon.com/blogs/big-data/share-data-securely-across-regions-using-amazon-redshift-data-sharing/
А вы уже освоили MongoDB — самую популярную NoSQL-базу данных?
MongoDB используют многие крупные компании, работающие с большими данными: Google, Twitter, Forbes и другие. MongoDB присущи кроссплатформенность, высокая скорость разработки, простота по сравнению с SQL и лёгкая масштабируемость. Знание этой БД выделит вас среди коллег и повысит вашу ценность на рынке труда.
Освоить систему поможет онлайн-курс «MongoDB» от OTUS. Для записи нужно пройти тест по MongoDB: https://otus.pw/mDJr/
Хотите протестировать учебный процесс заранее? Регистрируйтесь на бесплатный вебинар «Варианты установки MongoDB»: https://otus.pw/kF0D/
Это #партнёрский пост
What is the difference between a data lake and a data warehouse?
Read: https://www.startdataengineering.com/post/data-lake-warehouse-diff/
Датацентрический и моделецентрический подходы в машинном обучении
Код и данные — фундамент ИИ-системы. Оба эти компонента играют важную роль в разработке надёжной модели, но на каком из них следует сосредоточиться больше? В этой статье мы сравним методики, ставящие в центр данные, либо модель, и посмотрим, какая из них лучше; также мы поговорим о том, как внедрять датацентрическую инфраструктуру.
Читать: https://habr.com/ru/post/661457/
Write prepared data directly into JDBC-supported destinations using AWS Glue DataBrew
Read: https://aws.amazon.com/blogs/big-data/write-prepared-data-directly-into-jdbc-supported-destinations-using-aws-glue-databrew/
BI заместитель: Как сейчас быстро и недорого зарезервировать BI
Статья о том, как в нынешних условиях снизить критичность влияния санкций и прочих катаклизмов на пользователей данных в компании.
, про способ резервирования BI
Читать: https://habr.com/ru/post/661417/
Data Engineering Weekly #83
Read: https://www.dataengineeringweekly.com/p/data-engineering-weekly-83
12 актуальных вакансий для аналитиков
— Младший инженер-аналитик SOC
— Junior Data Аналитик
— Системный аналитик
— Продуктовый аналитик
— Аналитик
— Системный аналитик
— Продуктовый аналитик
— Middle Бизнес Аналитик
— Ведущий системный аналитик
— Ведущий аналитик
— Старший аналитик данных
— Старший системный аналитик
#вакансии #работа
Яндекс Практикум запустил акцию «Ученье, свет», чтобы создать приятную атмосферу для тех, кто будет учиться и работать из дома
В компании хотят «подсветить» этот не всегда лёгкий путь в новую профессию.
А чтобы получить набор подарков, достаточно купить курс до 4 мая. Вот полезные вещи, которые сделают учёбу комфортнее, а атмосферу вокруг уютнее:
— Умный браслет, чтобы научиться успевать все важные дела.
— Настольная лампа, чтобы читать онлайн-учебник или писать код по вечерам.
— Ночник, чтобы отдыхать от учёбы уютно.
— Кофеварка или чайник с подсветкой, чтобы заряжаться энергией, пока ищете первую работу в новой профессии.
Узнать больше об акции
Это #партнёрский пост
ИИ для прогнозирования тренда стоимости Bitcoin на данных Twitter. ч.1
ИИ для предсказания тренда цены BTC на данных Twitter
Читать: https://habr.com/ru/post/661141/
Develop and test AWS Glue version 3.0 jobs locally using a Docker container
Read: https://aws.amazon.com/blogs/big-data/develop-and-test-aws-glue-version-3-0-jobs-locally-using-a-docker-container/
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
