Data Analysis / Big Data
رفتن به کانال در Telegram
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels
نمایش بیشتر2 748
مشترکین
اطلاعاتی وجود ندارد24 ساعت
+87 روز
+2030 روز
آرشیو پست ها
Как мы перестали «угадывать продажи» в FMCG и начали их прогнозировать
Последние годы мы часто работаем с планированием и автоматизацией S&OP в FMCG. Видели десятки прогнозов в Excel, «на глаз», по прошлому году, с ручными коэффициентами на промо и вечными спорами между продажами и планированием.
И чтобы это исправить мы с командой создали и уже внедрили ML-модель, которая учитывает промо-эффекты и цены, работает с данными отгрузок, учитывает продажи с полки, автоматически очищает историю и многое другое. А результаты ее работы можно увидеть уже через 3 месяца после пилота.
Прочитать, как работает ML-модель.
Как мы перестали «угадывать продажи» в FMCG и начали их прогнозировать
Последние годы мы часто работаем с планированием и автоматизацией S&OP в FMCG. Видели десятки прогнозов в Excel, «на глаз», по прошлому году, с ручными коэффициентами на промо и вечными спорами между продажами и планированием.
И чтобы это исправить мы с командой создали и уже внедрили ML-модель, которая учитывает промо-эффекты и цены, работает с данными отгрузок, учитывает продажи с полки, автоматически очищает историю и многое другое. А результаты ее работы можно увидеть уже через 3 месяца после пилота.
Прочитать, как работает ML-модель.
Сравнительный обзор механизмов polling в Kafka и Pub/Sub в RabbitMQ: особенности и области применения
Друзья, привет! Меня зовут Андрей Комягин, я CTO компании STM Labs. Мы занимаемся разработкой очень больших распределённых высоконагруженных систем для различных отраслей, включая налоговое администрирование, телеком, track & trace и многие другие. В своих проектах и архитектурах мы широко применяем open-source-решения, включая брокеры сообщений, такие как Kafka и RabbitMQ.
Совсем недавно я выступил на конференции HighLoad++ Genesis 2025: рассказал про анатомию каждого из этих брокеров, сравнил их по набору критериев и оценил результаты их нагрузочного тестирования. А теперь решил выпустить этот материал в виде статьи в блоге, чтобы читатели Хабра тоже смогли изучить нюансы и понять, на какие задачи заточен каждый из брокеров. Итак, поехали!
О брокере Apache Kafka я очень подробно рассказал в своей предыдущей статье. Повторяться и снова разбирать его сегодня я не буду — вы можете перейти по ссылке выше и ознакомиться с материалом, а затем вернуться сюда.
Читать: https://habr.com/ru/articles/989590/
#ru
@big_data_analysis | Другие наши каналы
Как стать аналитиком данных за 6–12 месяцев [гайд]
В статье — полный разбор профессии: от ключевых навыков (SQL, Python, статистика) до карьерного пути и зарплат по регионам.
Читать: «Как стать аналитиком данных за 6–12 месяцев [гайд]»
#ru
@big_data_analysis | Другие наши каналы
Uber запустил подработку для водителей: разметка данных ИИ
Uber запустил пилот в 12 городах Индии: водители размечают данные для ИИ прямо в приложении, получая допдоход. Инициатива Uber AI Solutions может масштабироваться глобально.
Читать: «Uber запустил подработку для водителей: разметка данных ИИ»
#ru
@big_data_analysis | Другие наши каналы
Устраиваем свой Data QA с PyTest и фикстурами
Рабочий подход к тестированию трансформации данных в ETL-процессах. На примере Python-проекта с pytest, allure и psycopg2 демонстрируется, как автоматизировать создание и наполнение таблиц, хранить схемы и данные, а затем сравнивать результат.
Читать: «Устраиваем свой Data QA с PyTest и фикстурами»
#ru
@big_data_analysis | Другие наши каналы
Газпромбанк.Тех и Научно-технологический университет «Сириус» запускают интенсив по анализу данных и машинному обучению
Газпромбанк.Тех совместно с Научно-технологическим университетом «Сириус» объявляет о старте отбора на образовательный интенсив для будущих специалистов в области анализа данных и машинного обучения. Участие в программе полностью бесплатное.
Читать: «Газпромбанк.Тех и Научно-технологический университет «Сириус» запускают интенсив по анализу данных и машинному обучению»
#ru
@big_data_analysis | Другие наши каналы
Волны автоматизации в IT: эволюция требований рынка
Развитие ИТ с 1950 до наших дней рассмотрим 5 волн развития, что было со специалистами и технологиями. Попробуем угадать тренды и сделать рекомендации по развитию
Читать: «Волны автоматизации в IT: эволюция требований рынка»
#ru
@big_data_analysis | Другие наши каналы
С чего начать карьеру в ML в 2025: инструменты, навыки, практика
Хотите войти в ML в 2025 году? Рассказываем, как не утонуть: какие инструменты нужны, на чём писать, как учиться, что тренировать, куда выкладывать и где искать задачи.
Читать: «С чего начать карьеру в ML в 2025: инструменты, навыки, практика»
#ru
@big_data_analysis | Другие наши каналы
Будущее Python: какие тренды развития и боли языка обсуждали на PyCon 2025
Что обсуждали на PyCon 2025? Отказ от GIL в CPython 3.14, управление зависимостями, статический анализ, научный код, ML4Code и безопасность open source — всё о будущем Python.
Читать: «Будущее Python: какие тренды развития и боли языка обсуждали на PyCon 2025»
#ru
@big_data_analysis | Другие наши каналы
Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде
Продвинутая версия Gemini от Google DeepMind завоевала золотую медаль на IMO 2025, решив 5 из 6 задач. Впервые модель на естественном языке прошла официальную проверку жюри олимпиады — и доказала, что способна рассуждать, как лучшие молодые математики планеты.
Читать: «Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде»
#ru
@big_data_analysis | Другие наши каналы
ИИ без регистрации и VPN: быстрый доступ к GPT, Claude и Gemini
Как пользоваться GPT, Claude и Gemini в России без VPN и регистрации: подборка сервисов для быстрого старта.
Читать: «ИИ без регистрации и VPN: быстрый доступ к GPT, Claude и Gemini»
#ru
@big_data_analysis | Другие наши каналы
10 библиотек Python, которые меняют карьеру
10 библиотек Python, которые помогут прокачаться в аналитике, ML и разработке. Как они работают и почему меняют карьеру.
Читать: «10 библиотек Python, которые меняют карьеру»
#ru
@big_data_analysis | Другие наши каналы
Лучшие российские нейросети аналоги чата GPT, Chat-GPT на русском: ТОП-8 нейросетей, которые дают пользоваться западными нейросетями в России (GPT o4, Midjorney, Gemini, Dalle, Deepseek и др.)
Подборка из 8 сервисов, которые позволяют использовать ChatGPT, Midjourney, DALL·E и другие нейросети в России — без VPN, с русским интерфейсом и полным доступом.
Читать: «Лучшие российские нейросети аналоги чата GPT, Chat-GPT на русском: ТОП-8 нейросетей, которые дают пользоваться западными нейросетями в России (GPT o4, Midjorney, Gemini, Dalle, Deepseek и др.)»
#ru
@big_data_analysis | Другие наши каналы
Что такое SOC (Security Operations Center) и как он защищает данные
Что такое Security Operations Center. Показываем, как SOC защищает данные. Рассматриваем основные метрики и нюансы ✔ Tproger
Читать: «Что такое SOC (Security Operations Center) и как он защищает данные»
#ru
@big_data_analysis | Другие наши каналы
Geeks do it better: как прошла конференция GoCloud 2025 от Cloud.ru
Недавно мы побывали на большой конференции по облакам и искусственному интеллекту GoCloud, которую ежегодно проводит Cloud.ru. Делимся итогами конференции и рассказываем, как компании удается создавать топовые облачные сервисы и драйвить коммьюнити.
Читать: «Geeks do it better: как прошла конференция GoCloud 2025 от Cloud.ru»
#ru
@big_data_analysis | Другие наши каналы
Язык Julia: что это и почему он популярен в научных вычислениях
Что такое язык Julia. Показываем сравнение языка Джулия с другими. Рассматриваем преимущества и основные нюансы ✔ Tproger
Читать: «Язык Julia: что это и почему он популярен в научных вычислениях»
#ru
@big_data_analysis | Другие наши каналы
10 способов заработать на искусственном интеллекте в 2025
Топ-10 способов заработать на искусственном интеллекте. Как ИИ может приносить прибыль бизнесу и специалистам.
Читать: «10 способов заработать на искусственном интеллекте в 2025»
#ru
@big_data_analysis | Другие наши каналы
Анатомия данных: как устроено управление информацией
Объем информации растет, но без системного подхода данные превращаются в шум. Разбираемся, как в компаниях структурируют, анализируют и защищают данные, чтобы они работали на бизнес, а не создавали хаос.
Читать: «Анатомия данных: как устроено управление информацией»
#ru
@big_data_analysis | Другие наши каналы
«Умнейший ИИ в истории» Grok 3 представлен официально — Маск обещает революцию
xAI представила Grok 3 — «умнейший ИИ в истории», который превзошёл ChatGPT в анализе данных, генерации кода и поиске информации
Читать: ««Умнейший ИИ в истории» Grok 3 представлен официально — Маск обещает революцию»
#ru
@big_data_analysis | Другие наши каналы
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
