fa
Feedback
Data Analysis / Big Data

Data Analysis / Big Data

رفتن به کانال در Telegram

Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels

نمایش بیشتر
2 744
مشترکین
+224 ساعت
-97 روز
+330 روز
آرشیو پست ها
Oracle Analytics Best Practices: Performance Tuning with Excluded Columns This article highlights the best practice of removing any redundant columns from badly performing analyses. This simple step can likely provide significant performance gains. Read: https://blogs.oracle.com/analytics/post/oacperformancetuningexcludecols

Evaluate network perimeters impact on Oracle Analytics Cloud migrations Evaluate network perimeters impact on Oracle Analytics Cloud migrations Read: https://blogs.oracle.com/analytics/post/oac-dmu-np

[recovery mode] Структурирование кредитного портфеля методами машинного обучения Кредитные организации естественным образом располагают большими портфелями клиентских кредитов. Большими - в том смысле, что к ним начинают быть применимы законы больших чисел, предельные теоремы, а значит, и аппарат статистики, что делает естественным применение машинного обучения. Задача разбиения кредитного портфеля на более однородные по качеству кредитов под-портфели встречается в финансах уже давно: так многие десятки лет структурируются и синдицируются студенческие займы, долги по кредитным картам, ипотечные обязательства для продажи инвесторам в виде ABS (Asset Backed Sequrities, или "ценные бумаги, обеспеченные активами"). Ярким примером такой однородной группы ABS являются печально известные subprime MBS (Mortgage Backed Sequrities, или "ценные бумаги, обеспеченные ипотечными обязательствами") – категория самых ненадёжных ипотечных займов, из-за которых разгорелся кризис 2007-2008 годов. MBS сектора кроме subprime: jumbo, prime и alt-A. Для определения к какому сектору относится конкретный ипотечный кредит, используется как правило всего пара признаков (сумма кредита, кредитный рейтинг должника). В этой статье мы рассматриваем задачу разбиения кредитного портфеля с использованием гораздо большего количества признаков: всей информации, которой обладает кредитор. Читать: https://habr.com/ru/articles/737086/

Как разработать модель выявления связанных компаний на основании анализа транзакций На связи команда по разработке риск-моделей для крупного корпоративного, а также малого и среднего бизнеса банка «Открытие» Андрей Бояренков и Кирилл Козлитин. Сегодня мы хотим поделиться с вами процессом разработки модели выявления связанных компаний на основании транзакционных данных. Пришли к нам заказчики и говорят: «Хотим по имеющимся транзакциям наших клиентов определять, кто из контрагентов является с ними связанным». Читать: https://habr.com/ru/companies/otkritie/articles/736990/

Что такое Self-Service BI и зачем он нужен? Habr, привет! Меня зовут Женя, и в настоящий момент я лидер направления Self-Service BI в крупном FMCG. Очень хочется начать делиться с вами своими знаниями и наработками, поэтому в рамках первой небольшой статьи решил рассказать вам максимально просто о том, а же такое Self-Service BI. Поэтому давайте познакомимся с основными подходами к построению Business Intelligence и поймем, почему важен процесс Self-Service. Читать: https://habr.com/ru/articles/736978/

Бигдата, ты ли это? Возможно ли не замечать “лишних” 30 Tb данных на SSD при живом настроенном мониторинге  и героически их обслуживать? Запросто, а ответы на вопросы кто же эти наблюдательные люди, как им это удалось и причем здесь PostgreSQL - ниже. Читать: https://habr.com/ru/articles/736460/

Как следить за здоровьем GreenPlum Вопрос мониторинга GreenPlum часто оказывается непростым, особенно когда на платформе хранится действительно много данных, а запросы пользователей часто меняются. В этом посте я расскажу, как мы в «Леруа Мерлен» настраиваем инструменты Observability, находим узкие места и поддерживаем SLA кластера с GreenPlum на высоком уровне без использования проприетарных решений. Статья будет полезна DWH-архитекторам и DevOps’ам, которые планируют или уже эксплуатируют достаточно большие GP-инсталляции. Читать: https://habr.com/ru/companies/leroy_merlin/articles/735970/

Loading Data from Oracle Object Storage into Oracle Fusion Analytics This blog explains how to load data from Oracle Object Storage into Oracle Fusion Analytics. Read: https://blogs.oracle.com/analytics/post/loading-data-from-oss-into-oracle-fusion-analytics

Как построить систему геоаналитики с применением ML Геоаналитика помогает бизнесу принимать решения: где открыть магазин, построить отель или возвести новостройку с учетом доступности и популярности локации, наличия конкурентов и сотен других факторов. Решать подобные аналитические задачи с большим количеством значимых признаков помогает машинное обучение. В этой статье мы рассмотрим примеры работы сервисов геоаналитики VK Predict. Выясним, какие модели машинного обучения используются при построении таких систем и из каких этапов состоит разработка продукта с возможностями геоаналитики. Статья подготовлена на основе вебинара команд VK Predict и VK Cloud. Читать: https://habr.com/ru/companies/vk/articles/734102/

Реализация функции потерь в Python Функции потерь Python являются важной частью моделей машинного обучения. Эти функции показывают, насколько сильно предсказанный моделью результат отличается от фактического. Существует несколько способов вычислить эту разницу. В этом материале мы рассмотрим некоторые из наиболее распространенных функций потерь. Ниже будут рассмотрены следующие четыре функции потерь. Читать: https://habr.com/ru/articles/736536/

Oracle named a Visionary in the 2023 Gartner® Magic Quadrant™ for Analytics and Business Intelligence Platforms Gartner assesses vendors and talks about their strengths in the research. The vendors covered are recognized based on their vision and execution, including factors like Sales Execution/Pricing, Marketing Execution, Marketing Strategy, Sales Strategy etc. For the fourth year in a row, Oracle has been named a Visionary in the Gartner Magic Quadrant for Analytics and BI (ABI) Platforms. Read: https://blogs.oracle.com/undefined/post/oracle-named-a-visionary-in-the-2023-gartner-magic-quadrant-for-analytics-and-business-intelligence-platforms

Oracle Analytics Server (OAS) 2023 Update is live Oracle Analytics Server (OAS) 2023 Update is live Read: https://blogs.oracle.com/proactivesupportepm/post/oracle-analytics-server-oas-2023-update-700-is-live

Advisor Webcast: Security Integration of Oracle Analytics Server with E-Business Suite ADVISOR WEBCAST: Security Integration of Oracle Analytics Server with E-Business Suite on March 29, 2023 (Doc ID 2920301.2) Read: https://blogs.oracle.com/proactivesupportepm/post/advisor-webcast-security-integration-of-oracle-analytics-server-with-e-business-suite

'Memory Saver' feature in Google Chrome may affect active usage of Oracle Analytics Google Chrome Version 110 and Later 'Memory Saver' Feature May Affect Active Usage of Oracle Analytics Read: https://blogs.oracle.com/proactivesupportepm/post/memory-saver-feature-in-google-chrome-may-affect-active-usage-of-oracle-analytics

Five things you may not know you could do with dataset authoring in the Dataset Editor of Oracle Analytics Cloud This post explains powerful things you can do with dataset authoring in Oracle Analytics Cloud. Read: https://blogs.oracle.com/undefined/post/five-things-you-may-not-know-you-could-do-with-the-dataset-authoring-in-oracle-analytics-dataset-editor

Oracle Analytics technical support videos are available Now available: Oracle Analytics technical support videos Read: https://blogs.oracle.com/proactivesupportepm/post/oracle-analytics-technical-support-videos-are-available

Real-World Performance Testing for Oracle Analytics Cloud with Apache JMeter Oracle Analytics Cloud (OAC) is a comprehensive platform that enables organizations to analyze data and gain insights in real-time. Performance testing is an essential step to ensure that OAC can handle the expected workload without compromising its performance. Read: https://blogs.oracle.com/undefined/post/real-world-performance-testing-for-oracle-analytics-cloud-with-apache-jmeter

What Is Oracle Cloud Infrastructure Data Catalog? Oracle announces Oracle Cloud Infrastructure Data Catalog, a brand new tool to manage and govern your big data. Organize, enrich, search, and consolidate data in a way that expedites and optimizes your data lake. Read: https://blogs.oracle.com//post/what-is-oracle-cloud-infrastructure-data-catalog

Four Key Things to Do with Machine Learning Is your organization getting the most out of machine learning? Learn the four keys to effective machine learning. Read: https://blogs.oracle.com//post/four-key-things-to-do-with-machine-learning