Data Analysis / Big Data

رفتن به کانال در Telegram

Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels

نمایش بیشتر

شبکه:Типичный программист روسيا177 196 فناوری و برنامه‌ها26 881

2 751

مشترکین

-224 ساعت

+67 روز

+1830 روز

164

نمایش های پست

اطلاعاتی وجود ندارد24 ساعت

اطلاعاتی وجود ندارد48 ساعت

5.97%

نرخ مشارکت

اطلاعاتی وجود ندارد

پست های در روز

Ads index

beta

آرشیو پست ها

2 751

Сколько зарабатывает айтишник и как на это живёт: сравниваем 5 стран Cобрали опыт зарплат айтишников из пяти стран и узнали, как вписаться в местную культуру и где комфортнее жить. Читать: «Сколько зарабатывает айтишник и как на это живёт: сравниваем 5 стран» #ru @big_data_analysis | Другие наши каналы

2 751

Как создать чат-бота с LLM? История о том как я потратил 5 лет на изучении llm ботов и в итоге написал своего за пол года. Пути реализации и ошибки. Читать: https://habr.com/ru/articles/988358/ #ru @big_data_analysis | Другие наши каналы

2 751

Сравниваем форматы сериализации на Go: скорость и удобство Дмитрий Королёв, бэкенд-разработчик в Авито, разобрал на примерах, чем отличаются друг от друга форматы сериализации данных и как выбрать самый удобный. Читать: «Сравниваем форматы сериализации на Go: скорость и удобство» #ru @big_data_analysis | Другие наши каналы

2 751

Geeks do it better: как прошла конференция GoCloud 2025 от Cloud.ru Недавно мы побывали на большой конференции по облакам и искусственному интеллекту GoCloud, которую ежегодно проводит Cloud.ru. Делимся итогами конференции и рассказываем, как компании удается создавать топовые облачные сервисы и драйвить коммьюнити. Читать: «Geeks do it better: как прошла конференция GoCloud 2025 от Cloud.ru» #ru @big_data_analysis | Другие наши каналы

2 751

10 телеграм-каналов, которые реально читают сеньоры Собрали топ-10 каналов для опытных разработчиков, с которыми у вас точно будет что обсудить на дейлике. Читать: «10 телеграм-каналов, которые реально читают сеньоры» #ru @big_data_analysis | Другие наши каналы

2 751

Open Table Formats — Iceberg vs Paimon — практика использования Привет, Хабр. Меня зовут Василий Мельник, я product owner решения для потоковой обработки данных Data Ocean SDI в компании Data Sapience. Наша команда приобрела большой практический опыт работы с Apache Iceberg в задачах на стыке традиционной пакетной обработки и near real-time и конкретно с использованием технологий на базе Flink, поэтому мы не могли пройти мимо нового открытого табличного формата (OTF) Paimon от разработчиков Apache Flink. В этой статье я опишу наш опыт и те практические выводы, которые мы сделали на промышленных средах, в виде репрезентативного тестирования, на котором проиллюстрирую ключевые практические сценарии. Читать: https://habr.com/ru/companies/datasapience/articles/988308/ #ru @big_data_analysis | Другие наши каналы

2 751

Генерация данных с помощью Python: зачем это нужно и как применять Генерация данных с помощью Python. Зачем это нужно и как применять. Рассматриваем основные библиотеки и примеры ✔ Tproger Читать: «Генерация данных с помощью Python: зачем это нужно и как применять» #ru @big_data_analysis | Другие наши каналы

2 751

Язык Julia: что это и почему он популярен в научных вычислениях Что такое язык Julia. Показываем сравнение языка Джулия с другими. Рассматриваем преимущества и основные нюансы ✔ Tproger Читать: «Язык Julia: что это и почему он популярен в научных вычислениях» #ru @big_data_analysis | Другие наши каналы

2 751

Автоматизированные системы мониторинга моделей машинного обучения с помощью нашего open source фреймворка Любая модель машинного обучения начинается с данных. Известное выражение «garbage in, garbage out» как нельзя лучше описывает главную уязвимость ML‑систем. В автоматизированном машинном обучении (AutoML) наиболее критичными точками являются процесс сборки данных и проблема мониторинга данных, в т.ч. в онлайне. Если процессы feature engineering и обучения наша библиотека формализует «из коробки» с помощью конфигурационных файлов и единых правил, то ответственность за загрузку и получение данных несет пользователь. Читать: https://habr.com/ru/companies/vsk_insurance/articles/988282/ #ru @big_data_analysis | Другие наши каналы

2 751

Мультистек: как жить, когда ты и Фронт, и Бэк, и МЛ Разбираем плюсы и минусы пути мультистек-инженера: когда это работает, где востребовано, и как развиваться, если не хочешь выбирать одно направление. Читать: «Мультистек: как жить, когда ты и Фронт, и Бэк, и МЛ» #ru @big_data_analysis | Другие наши каналы

2 751

Python и SQL: что изучать в первую очередь для анализа данных Python и SQL — самые популярные инструменты для работы с данными. Но какой из них изучать первым? Разбираемся в статье. Читать: «Python и SQL: что изучать в первую очередь для анализа данных» #ru @big_data_analysis | Другие наши каналы

2 751

Сравниваем Pandas, Polars и PySpark: что выбрать аналитику? Pandas, Polars или PySpark — что выбрать для работы с данными? Вместе с Никитой Егоровым, ведущим аналитиком в МТС Диджитал, разбираем отличия, плюсы и минусы каждого инструмента. Читать: «Сравниваем Pandas, Polars и PySpark: что выбрать аналитику?» #ru @big_data_analysis | Другие наши каналы

2 751

С помощью чего выучить SQL в 2025 году? Как выучить SQL с нуля в 2025? Сравниваем 6 платформ: SYNC STUDY, SQL Academy, Karpov Courses и другие. Бесплатные и платные курсы, задачи из реальной аналитики, поддержка PostgreSQL. Советы по выбору для новичков и профессионалов. Читать: «С помощью чего выучить SQL в 2025 году?» #ru @big_data_analysis | Другие наши каналы

2 751

Курсы по Big Data, включая онлайн-обучение для аналитиков больших данных Самые лучшие курсы по Big Data. В предложенной подборке актуальные варианты обучения от проверенных школ, а так же рейтинги и цены на курсы для аналитиков Big Data Читать: «Курсы по Big Data, включая онлайн-обучение для аналитиков больших данных» #ru @big_data_analysis | Другие наши каналы

2 751

Рекомендательные системы и реализация Content-based системы Введение в рекомендательные системы: идеи, типы, метрики, преимущества и недостатки. Реализация content based системы для аниме Читать: «Рекомендательные системы и реализация Content-based системы» #ru @big_data_analysis | Другие наши каналы

2 751

Анатомия данных: как устроено управление информацией Объем информации растет, но без системного подхода данные превращаются в шум. Разбираемся, как в компаниях структурируют, анализируют и защищают данные, чтобы они работали на бизнес, а не создавали хаос. Читать: «Анатомия данных: как устроено управление информацией» #ru @big_data_analysis | Другие наши каналы

2 751

Как мы нашли утекающую маржу в сети кофеен на 240 000 чеков/мес: путь от Excel к ежедневной управляемости В сети 26 кофеен на 240k чеков в месяц всё выглядело достаточно хорошо (поток гостей, выручка растёт, но прибыль не соответствует ожиданиям). Рассказываю, как мы собрали ежедневную BI аналитику для управления сетью: от R-Keeper и ETL до витрин в ClickHouse и дашбордов в Yandex DataLens. По дороге упёрлись в типичную проблему: справочники, из-за которых отчёты неточны. Читать: https://habr.com/ru/articles/988222/ #ru @big_data_analysis | Другие наши каналы

2 751

Что значит быть инженером в новых реалиях? И какой смысл мы вкладываем в эти слова — расскажем на GPB CONF! 22 апреля пройдет конференция Газпромбанк.Тех для разработчиков и инженеров. Читать: «Что значит быть инженером в новых реалиях? И какой смысл мы вкладываем в эти слова — расскажем на GPB CONF!» #ru @big_data_analysis | Другие наши каналы

2 751

Python vs C++: какой язык быстрее найдет все простые числа до миллиарда Рассказываем, какие есть алгоритмы для поиска простых чисел и реализуем наиболее популярный и простой на Python и C++. Читать: «Python vs C++: какой язык быстрее найдет все простые числа до миллиарда» #ru @big_data_analysis | Другие наши каналы