fa
Feedback
Data Analysis / Big Data

Data Analysis / Big Data

رفتن به کانال در Telegram

Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels

نمایش بیشتر
2 742
مشترکین
-224 ساعت
-27 روز
+130 روز
آرشیو پست ها
Statistical Analysis For this project I used Descriptive and inferential statistical methodologies to help create a proactive
Statistical Analysis For this project I used Descriptive and inferential statistical methodologies to help create a proactive ‘alarm’, to accurately identify Pump Failures with Horse Power (HP) and Pump Efficiency (PE) emerging as key variables of interest with deviatio... Read: https://nicoletalkstech.hashnode.dev/statistical-analysis

Tableau Resume I really enjoyed creating this interactive resume via Tableau. I never used Tableau prior to this week. I just
Tableau Resume I really enjoyed creating this interactive resume via Tableau. I never used Tableau prior to this week. I just set my intentions to do my very best and pushed through. In this project, I used a Gannt chart, treemap, and a donut chart to measure my sk... Read: https://nicoletalkstech.hashnode.dev/tableau-resume

My Story Hello, My name is Nicole Coleman. I have obtained a Bachelor of Science in Media Communication from Full Sail Univer
My Story Hello, My name is Nicole Coleman. I have obtained a Bachelor of Science in Media Communication from Full Sail University and a Master's Degree in Public Administration with an emphasis in Government Management from DeVry University. My special skills... Read: https://nicoletalkstech.hashnode.dev/my-story

Oracle Analytics platform for both business and IT-led analytics Learn about mode 1 and mode 2 analytics, and why every organization needs both. Read: https://blogs.oracle.com/analytics/post/oracle-analytics-platform-for-both-business-and-it-led-analytics

Persist and analyze metadata in a transient Amazon MWAA environment Read: https://aws.amazon.com/blogs/big-data/persist-and-a
Persist and analyze metadata in a transient Amazon MWAA environment Read: https://aws.amazon.com/blogs/big-data/persist-and-analyze-metadata-in-a-transient-amazon-mwaa-environment/

Use Amazon CodeGuru Profiler to monitor and optimize performance in Amazon Kinesis Data Analytics applications for Apache Fli
Use Amazon CodeGuru Profiler to monitor and optimize performance in Amazon Kinesis Data Analytics applications for Apache Flink Read: https://aws.amazon.com/blogs/big-data/use-amazon-codeguru-profiler-to-monitor-and-optimize-performance-in-amazon-kinesis-data-analytics-applications-for-apache-flink/

Основные тренды ЦОД в 2022 году и примеры проектов Привет, Хабр! Компания Acer снова с вами! Мы планируем рассказывать об интересных продуктах: как своих, так и других участников рынка. В первую очередь речь пойдет о серверах и соответствующих корпоративных решениях. Сегодня же публикуем первый свой пост – это аналитика наиболее заметных трендов на рынке ЦОД в 2022 году. Главный принцип, по которому мы отбирали тренды – наличие примеров практического внедрения. Кроме того, мы расскажем о необычных разновидностях дата-центров, которых становится все больше. Читать: https://habr.com/ru/post/658357/

Date range query on partitioned date columns on pyspark In the recent past I have been working on spark. One of the fundament
Date range query on partitioned date columns on pyspark In the recent past I have been working on spark. One of the fundamental requirements which you will come across on spark is to filter the data on a partitioned date range. If you are lucky and the data is a flat partition using date, then the query i... Read: https://sharathmysore.hashnode.dev/date-range-query-on-partitioned-date-columns-on-pyspark

The Data Founder Story: Time to Zingg! By Sonal Goyal Read: https://www.dataengineeringweekly.com/p/the-data-founder-story-ti
The Data Founder Story: Time to Zingg! By Sonal Goyal Read: https://www.dataengineeringweekly.com/p/the-data-founder-story-time-to-zingg

Маркетинговая аналитика на Python. Пишем код для RFM-сегментации RFM - классический инструмент маркетинга для сегментации вашей клиентской базы. Я использую ее для работы в В2В, В2G сегменте. В основе него - понятные управленцу ценности: LTV и Purchase Frequency. Как можно строить сегменты с помощью Python - читайте в материале. Читать: https://habr.com/ru/post/658225/

Scrape Google Scholar Metrics Results to CSV with Python What will be scraped 📌Note: you have an option to save CSV file fro
Scrape Google Scholar Metrics Results to CSV with Python What will be scraped 📌Note: you have an option to save CSV file from public access mandates but there will be no funder link. This blog post shows how to scrape funder link. If you don't need an explanation: try the code in the online IDE. Pre... Read: https://serpapi.hashnode.dev/scrape-google-scholar-metrics-results-to-csv-with-python

Scrape Google Scholar Metrics Results to CSV with Python What will be scraped 📌Note: you have an option to save CSV file fro
Scrape Google Scholar Metrics Results to CSV with Python What will be scraped 📌Note: you have an option to save CSV file from public access mandates but there will be no funder link. This blog post shows how to scrape funder link. If you don't need an explanation: try the code in the online IDE. Pre... Read: https://dimitryzub.hashnode.dev/scrape-google-scholar-metrics-results-to-csv-with-python

Циклы и функционалы в языке R (бесплатный видео курс) Одним из лучших и правильных инвестиций времени в кризис является обучение. В этой статье я расскажу о новом, бесплатном курсе по языку R. В данной публикации вы найдёте ссылку на курс, подробное описание курса и программу. Читать: https://habr.com/ru/post/651979/

Циклы и функционалы в языке R (бесплатный видео курс) Одним из лучших и правильных инвестиций времени в кризис является обучение. В этой статье я расскажу о новом, бесплатном курсе по языку R. В данной публикации вы найдёте ссылку на курс, подробное описание курса и программу. Читать: https://habr.com/ru/post/651979/

Docker Everything Bagel: как развернуть локальный стек данных Container au Havre pour les 500 ans by 0Lifea. При разработке Open-source-проекта важно помогать пользователям и оставлять рекомендации. Но чтобы это делать, иногда нужно буквально «прочувствовать их боль»: воссоздать их рабочую среду, запустить тот же код и посмотреть на ту же ошибку. А учитывая сложность современных стеков данных, это бывает непросто. Команда Kubernetes aaS VK Cloud Solutions перевела статью об инструменте Everything Bagel, который позволяет эффективнее работать с локальными стеками данных. Читать: https://habr.com/ru/post/657207/

JavaScript редактор диаграмм, который открывает диаграммы из PNG картинок (open source) dgrm.net | GitHub dgrm.net - это редактор диаграмм, с прицелом на трансформацию в карту знаний. Отличительные особенности: - аскетичность, - работает на телефонах (одно из немногих web-решений), - открытый исходный код. В процессе разработки появляются интересные моменты. Статья про один из таких моментов: чтение данных из PNG. Исходный код для использования в своих проектах прилагается. Читать: https://habr.com/ru/post/658109/

Up to 15 times improvement in Hive write performance with the Amazon EMR Hive zero-rename feature Read: https://aws.amazon.co
Up to 15 times improvement in Hive write performance with the Amazon EMR Hive zero-rename feature Read: https://aws.amazon.com/blogs/big-data/up-to-15-times-improvement-in-hive-write-performance-with-the-amazon-emr-hive-zero-rename-feature/

Analysing American Baby Name Trends with Python Introduction to EDA Exploratory data analysis (or EDA) is a way to analyse da
Analysing American Baby Name Trends with Python Introduction to EDA Exploratory data analysis (or EDA) is a way to analyse data sets in order to summarize or to know about their main characteristics, often by analysing trends and through graphics and other data visualisation methods. We try to fin... Read: https://rishav10.hashnode.dev/analysing-american-baby-name-trends-with-python

Orchestrating Data Pipelines at Lyft: Comparing Flyte and Airflow This article was originally published on the Lyft Engineeri
Orchestrating Data Pipelines at Lyft: Comparing Flyte and Airflow This article was originally published on the Lyft Engineering blog on March 25th, 2022. Introduction In a data-driven company like Lyft, data is the core backbone for many application components. Data analytics gives us the incentives for improving e... Read: https://blog.flyte.org/orchestrating-data-pipelines-at-lyft-comparing-flyte-and-airflow

Ускорение семантической сегментации при помощи машинного обучения Зачем создавать процесс разметки данных на основе ML? Быстрое создание высококачественной разметки данных — сложная задача. Парсинг и правильное аннотирование изображений и видео, обычно используемых в сфере беспилотного транспорта или робототехники, могут быть композиционно сложны даже для людей. Наша компания использует машинное обучение, чтобы дополнить реализуемые людьми рабочие процессы, позволяя повысить и качество, и скорость разметки. Так как модели глубокого обучения могут испытывать трудности с устойчивой производительностью в предметных областях с большим разнообразием данных, например, в сценах с участием беспилотных автомобилей, для обеспечения стабильно высокого качества необходимо найти оптимальный баланс между ML-автоматизацией и человеческим контролем. Читать: https://habr.com/ru/post/655227/